人人都该都懂的互联网思维
上QQ阅读APP看书,第一时间看更新

透视互联网

1.网络变成了一个巨大的信息生态系统,能用来定量地检测关于人类行为和社会性互动作用的理论。

2.在《人人都该懂的互联网思维》这本书中,我将提供网络上显现的若干定律,以及它们对理解某些社会现象、设计更好的信息访问机制的影响。

3.网络浏览体现出了一种模式,揭示了人们在寻找信息时呈现出的一种规律,以及如何将这些认识转变成设计更好网站的方法。同样,我也希望传达对于研究大规模社会动力学的方法的感受,它源于我们研究互联网现象的实践,这些实践在信息时代为我们研究社会行为提供了一个全新的途径。

在加州旧金山风景如画的普雷西迪奥区(Presidio)的一栋小楼里,一群人做了一件意义非凡的工作——这大概发生在1996年,是类似某种规模庞大的生态调查,但他们不需要离开自己的办公桌。计算机工作站中的一个程序在互联网的疆域里“爬行”原文为“crawl”,被用来形象地描述一个程序从网上不断获取网页的行为,它的直译是“爬行”,表示该程序顺着网页中的超链接,递进地获得一篇篇网页的过程。这个程序叫“crawler”或“爬取器”,也叫“爬虫”。——译者注,源源不断地为这群互联网档案馆(Internet Archive)的工作人员抓取网页,并将其存储起来。为了未来的研究,这群工作人员要收集并存储整个网络上的文本内容,从硅谷的网站到遥远的地球另一面的服务器上的网页。在某种意义上,他们不仅像生态学家,而且也在构造一个图书馆,其规模不久就要使世界上那些非常大的图书馆,如美国国会图书馆或法国国家图书馆,相形见“小”了。到2000年7月,他们已经收集了10亿个网页,占33.5 TB(万亿字节)的存储空间,并且其收藏的规模在以每月10%的速度增长。北京大学网络实验室从2001年开始了类似的工作,到2009年已经搜集了30多亿个中国网站上的网页,获得的数据超过50 TB,并且以每天约200万个网页的速度增长。——译者注为了理解这个收藏的规模,我们可以和书籍做个对比。一本书的文字内容经数字化后对应的数据量约为1 MB(兆字节),1 TB约等于100万MB,美国国会图书馆中有2 000万册书,数据规模大约是20 TB(而且不包括图片)。