01 定律1 网络是基于隐形定律增长的生态_人人都该都懂的互联网思维-QQ阅读男生都市网

上QQ阅读APP看书，第一时间看更新

透视互联网

1．网络变成了一个巨大的信息生态系统，能用来定量地检测关于人类行为和社会性互动作用的理论。

2．在《人人都该懂的互联网思维》这本书中，我将提供网络上显现的若干定律，以及它们对理解某些社会现象、设计更好的信息访问机制的影响。

3．网络浏览体现出了一种模式，揭示了人们在寻找信息时呈现出的一种规律，以及如何将这些认识转变成设计更好网站的方法。同样，我也希望传达对于研究大规模社会动力学的方法的感受，它源于我们研究互联网现象的实践，这些实践在信息时代为我们研究社会行为提供了一个全新的途径。

在加州旧金山风景如画的普雷西迪奥区（Presidio）的一栋小楼里，一群人做了一件意义非凡的工作——这大概发生在1996年，是类似某种规模庞大的生态调查，但他们不需要离开自己的办公桌。计算机工作站中的一个程序在互联网的疆域里“爬行” 原文为“crawl”，被用来形象地描述一个程序从网上不断获取网页的行为，它的直译是“爬行”，表示该程序顺着网页中的超链接，递进地获得一篇篇网页的过程。这个程序叫“crawler”或“爬取器”，也叫“爬虫”。——译者注，源源不断地为这群互联网档案馆（Internet Archive）的工作人员抓取网页，并将其存储起来。为了未来的研究，这群工作人员要收集并存储整个网络上的文本内容，从硅谷的网站到遥远的地球另一面的服务器上的网页。在某种意义上，他们不仅像生态学家，而且也在构造一个图书馆，其规模不久就要使世界上那些非常大的图书馆，如美国国会图书馆或法国国家图书馆，相形见“小”了。到2000年7月，他们已经收集了10亿个网页，占33.5 TB（万亿字节）的存储空间，并且其收藏的规模在以每月10%的速度增长。北京大学网络实验室从2001年开始了类似的工作，到2009年已经搜集了30多亿个中国网站上的网页，获得的数据超过50 TB，并且以每天约200万个网页的速度增长。——译者注为了理解这个收藏的规模，我们可以和书籍做个对比。一本书的文字内容经数字化后对应的数据量约为1 MB（兆字节），1 TB约等于100万MB，美国国会图书馆中有2 000万册书，数据规模大约是20 TB（而且不包括图片）。