1066年,诺曼底公爵威廉二世(Duke William II)跨越英吉利海峡,来争夺撒克逊(Saxon)国王哈罗德二世(Harold II)的王冠。那年10月,正如英国小学生一直以来所学到的,当时天气异常清爽,天空略显灰色,两支军队在东萨塞克斯(East Sussex)的黑斯廷斯(Hastings)相遇。最终,哈罗德被杀死,威廉及由其支持者、封臣和雇佣兵组成的军队大获成功。于是,英格兰开启了诺曼人的统治时代,威廉因此也永久赢得了“征服者”的美名。
20年之后,征服者威廉王以和平的方式统治着王国,然而这并非是一剂安逸的处方。这个世界不是一处和平之地,而与国外或国内任何敌人的争夺,都需要资源。可是,他的王国事实上拥有些什么资源呢?有多少土地?庄稼和牲畜的收成可以有多少?国家有多少人口,而实际财富和潜在的财富又有多少?为了回答这些问题,同以前的统治者和自那时起所有的政府一样,威廉迈出了他所能做的第一步。他向王国的每个角落都派出了下属,询问这些问题并记录下答案。
正如这位国王的编年史家所解释的:“他将他的人派到英国的每一个郡,以查明每个郡有多少被‘隐匿’的土地;在这个国家,国王自己拥有的土地和牲畜的数量有多少;每年来自于各郡的合法税捐又是多少。他也将他的大主教们所拥有的土地记录在案,还有他的教区主教、男修道院院长及他的伯爵们的土地(我的叙述可能过于详细了)。英国的每位地主拥有什么,或者说有多少土地或牲畜,以及值多少钱。他十分仔细地完成了这项调查,结果是没有一项隐匿的财产能幸免,即使是一头牛,或是在他的调查中逃避注意的一头猪。而且所有的这些调查的结果随后都呈到了他面前。”
这项工作在1086年完成,当时每个封建领主的领地都已经调查完毕。每一个村庄都接受了调查,居民人数得以统计。来自各郡和各教区的信息,都已呈报给威廉王并检阅完毕。调查结果被装订在一个巨大的手写本中,从那时起它就以《末日审判书》(The Domesday Book)而闻名于世,该名字源自“审判日”(the Day of Judgment)。“因为对最终账户的判定是严格和可怕的,无法用任何诡计来逃避”,后来的一位朝臣解释道,“所以当这本书里所包含的那些事物被判定后,它就不能够被撤销,或是驳回”。
这本书因其严苛和全面而受到欢迎,却也因自身的许多缺陷而饱受诟病。某一个郡的巡视员所提的问题,并非总是和其他郡的巡视员提出的问题一模一样。北方的某些郡是通过对诺曼人发动战争而夺得的,这些地方并没有被包括在这本书之内。物质商品在财富统计中处于绝对优先的顺序;人口则次要一些。教会是一股强大的势力,也是主要的土地拥有者,但是在全国各地的统计中完全被忽略了,或许是因为主教们和牧师们拒绝与国王的代表合作,又或者是因为调查者们并不认为这些土地和商品应当包括在内,因为它们属于某一个仅在一定程度上对国王负责的宗教机构。
尽管如此,《末日审判书》还是自罗马人之后首次对英国经济生活进行的统计调查记录。古代人有着他们自己的记账工具,希腊人、罗马人、波斯人、巴比伦人、埃及人都是如此。中国人及他们的各个朝代也有记账工具。所有的统计者都明白计算其拥有的资源的重要性,比如有多少武器,有多少谷物,以及从他们的国民那里可以收多少的税,哪些项目可以征税,哪些军队可以召集。在计量这些数字时,有些人做得好一些,有些人则表现得差一些,但是所有人都已经做出了尝试。不过,只有少数人成功地做到了不让这一记录成为一个暂时的、不固定的和最终有瑕疵的概况描述。
在一千年以前这种情形是真实的,而且在今天,同样也与现实相符。两者主要的区别在于,那时的瑕疵是缺少完善的模型,也未能完全理解计数和加法之间的差别;而现在则会创造出一些指标,以便对不同的时间段进行衡量和比较,看看你做得更好、更差,还是仅仅在白费力气。
《末日审判书》也暴露出了统计资料和经济指标的主要困境:你定义事物重要性的标准,决定了哪些事物将会统计在内。任何一位商业人士或政府人士都可以证实,只要是能够度量的事情,就能做好。那些没办法度量的事情,从它所得到的关注来看,或许压根儿就不存在。由于没有按照和封建领地一样严格的标准将教会包括在内,《末日审判书》低估了英国的物质实力和潜在的产出水平。因为其目标是评估国王和王权的实力,所以忽略教会是有一定道理的。不过,这也令英国看起来比实际要更弱。随后的君主慢慢意识到了这一点,并最终导致亨利八世(Henry VIII)剥夺了教会的巨大财富,从而使英国所有的资源都归于国王的支配之下。
在随后的几个世纪里,历任英国统治者及欧洲其他国家的统治者,均对其王国展开了一些调查,几乎都是为了弄清楚到底可以征收多少税赋。各国对衡量其国民产出所做出的最早的、最初的努力,可以视为当代衡量国内生产总值的先声。尽管这些努力一直在继续,所用的方法却并没有显著的发展。创新和想象力都用在测量宇宙、为地球绘制地图,弄清楚地球是圆的还是平的,发明新的导航工具和更好的战争工具,以及提升艺术、音乐及建筑方面的技能上面。在创新的成熟的和激动人心的领域,统计活动榜上无名。
16世纪,欧洲的帝国开始向大西洋扩张。到18世纪时,这一范围扩大到了全球。为了保证自己能在西欧得以幸存,从弱小的荷兰到西班牙帝国这样的大国,都想在新世界的资源中分一杯羹,起初是北美洲和南美洲,接着是亚洲,最后是非洲。为了开发和利用贸易的成果,政府需要尽可能多地掌握有关贸易的数据。
那时的政府和现在的政府一样,都依赖于一致的收入来源来维持其运行,并提供人们期望的各种服务。在近代之前,政府主要的收入来源,是从贵族那里征收的土地税,以及在贸易方面征收的关税。数世纪以来,对此进行完美记录的不是政府,而是商人们。他们不断改进会计方法和簿记方法,完善成本和收入的概念,并且成了推动银行业和信用票据发展的中心力量,而这些正是所有当代金融的前身。
然而,统治者需要并垂涎于商人们所创造的收益。于是,重商主义逐步形成,它见证了各种各样的帝国试图垄断与其遥远的殖民地之间的贸易往来,阻止外国势力以及外国商人进入这一领域。无论是哪种方式,不管是否采取重商主义,政府都强调要将对外贸易限制在有限的入境口岸,然后对这些口岸严密监控。装载的货物都被记录在案并进行评估,然后征收相应的关税。由英国议会历经数十年才批准、于1651年开始生效的著名的《航海条例》(Navigation Acts),将英国和美洲殖民地之间的贸易限定于英国船只和英国商人,并且要向英国王室缴纳英国的关税。法国和西班牙通过了它们自己版本的类似法律。这一系列法律的要点在于,很少有人能够自由地开展贸易活动,而不用面对国王的不满和沉重的处罚。
随着贸易成为国家的一个主要收入来源,并成为支持王权之间频繁战争的关键。贸易因此受到严密监控,而海盗行为则变得非常猖獗。如此一来,便激发了弗朗西斯·德雷克爵士(Sir Francis Drake)和沃尔特·雷利爵士(Sir Walter Raleigh)这类突击者的勇敢行为,他们拦截了西班牙国王的银船。美洲殖民地对这种状况也非常不满,随着18世纪逐渐逝去,这种不满变成了愤怒,并且很快转变成对英国王室的彻底反叛,而王室原本是想强化对美洲的控制,并垄断对美洲的所有贸易的税收。
进出口贸易额和税收、关税和分类账,这些都很好,也能充分确保王室的金库足够充裕,并不断得到充盈。然而,它们并不是现代的统计数据或者经济关键性指标。科学和数学对这些数据的演变,显然滞后于它对其他各行各业科学和数学的影响。
尽管如此,当数学从哲学中分离出来、艾萨克·牛顿(Isaac Newton)和戈特弗里德·莱布尼兹(Gottfried Leibniz)等17世纪的巨匠探索微积分学时,有一些人开始思索概率的本质以及理解概率的必要性,为的是准确衡量曾经处于动荡之中的物质世界。在这个世界中,有出生、死亡,有战争、饥荒,同时这个世界也是令人困惑的各种政治变化的万花筒。布莱斯·帕斯卡尔(Blaise Pascal)和皮埃尔·德·费马(Pierre de Fermat)均是17世纪中叶的数学家和哲学家,他们都曾深思过概率的本质。他们在书信中讨论了赌博的本质,以及所有概率游戏的最基础的东西:骰子的基本原理。费马因其未解答的长长的数学定理而更为出名,他深深地被可能性游戏所吸引。与费马通信的帕斯卡尔,更为有名的则是他在晚年撰写的随笔。在那段时期,他陷入了对某些基本问题的雄辩之中,比如人为什么不严肃地对待生命,这使得他找不到时间来玩17世纪版本的双骰子赌博游戏。出于对骰子的共同热爱,他们的沉思跨度很大,从如何确定一个人口稠密的城市的人口数量,到寻找方法去解释和调整看似简单的表格中不可避免的差错。他们并没有用当代统计学或统计学家那样的语言来发言;他们也不使用“抽样误差”这类的术语,但是他们把握了一个基本的事实:当试图对复杂系统进行统计时,人类经常会犯错。当人们试图,正如他们经常做的那样,将复杂的系统缩减为简单的数字时,他们会犯更大的错误。
在18世纪之前,“统计学”这个词甚至用得都不太多,而且人们常常将它的起源归于一个叫戈特弗里德·阿亨华尔(Gottfried Achenwall)的德国人,他将拉丁语和意大利语的词语组合在一起,创造出statistic这个术语,以指代有关国家的数据。最初的统计学领域,实际上不如说是一片旷野。通常只有那些极其稀有的、天天摆弄字母和公式的人对这一领域感兴趣,这些人往往具有天文学家、炼金师和工程师等多重身份。以“法国的牛顿”(French Newton,至少对于讲英语的世界而言)而为人们所知的皮埃尔-西蒙·拉普拉斯最终赋予了其现代形式。在日渐衰落的法国旧体制下,拉普拉斯最关注的其实是绘制太阳系的地图,而他出色的工作完成于18世纪末,正好是旧体制将要在革命的血泊之中崩溃之时。在这些年里,他一直继续着自己的工作,而且在一定程度上得到了拿破仑的恩宠,后者永远留心于那些有可能阐明宇宙的意义,并帮助他统治宇宙的科学家。随后拉普拉斯撰写了《关于概率的哲学随笔》,自那时起,这本书便一直在塑造着我们构建统治世界的经济指标的方式。
在这本有几百页的简明随笔集之中,拉普拉斯阐明了一些基本的原理,即为何概率与几乎每一件事都相关,无论是陪审团的选择,还是评估人类的寿命有多长,都是如此。在我们当中,很少有人不熟悉“平均值”这样一个概念,然而拉普拉斯向我们展示了那些看起来简单的数字有多么复杂。仅仅取得出生登记和死亡记录,随后将它们加总再做除法,依靠这种简单的办法来计算死亡率显然是远远不够的。为什么呢?因为这样将极大地夸大人们在早年的死亡概率。其中的逻辑很清楚,然而却很容易被忽略。在那些年里,许多婴儿和刚刚学步的孩童很不幸地在成年之前就去世了。他们的死亡率要高出很多,如果在计算平均寿命时把他们包括在内,将会显著地降低整个社会寿命的平均预期值。可是一旦某个孩子跨过了最初的那些危险年份,预期寿命会长很多。这一点看起来或许很明显,然而事实并非如此。
拉普拉斯阐述了收集准确的统计数据所面临的挑战。他向我们更多地展示了一点,即你需要一个大样本,来确保你能克服生与死的各种特例,从而获得全方位的概率。除非在统计时将其他的许多样本包括在内,否则某一地区可能会因为遭受疾病、瘟疫或干旱的袭击,而扭曲死亡率的结果。他写道:“一张死亡率的表格,就是一张人类生命概率的表格。”想让这张表格足够准确,需要做的事比简单计数、做加法和除法多得多。拉普拉斯谱写了一首在数学和社会方面利用概率的颂歌,从而将统计学领域引入它的现代轨道。
在接下来的200年里,数理统计成为日益专业化的一个领域,与此同时,在19世纪中叶之前基本上不存在的一些学科体系,慢慢地完善起来。同时,另一套更加政治化、对数学关注较少的测量方法也逐步形成。当西方政府接受了代表工业和科学特点的精确和创新的精神时,它们更加渴望了解自己所统治的社会。这一点在美国体现得最为明显,在其颁布的《美国宪法》中,至少嵌入了一个统计数值。
尽管《末日审判书》与《美国宪法》间跨跃了700年,但是在某些方面它们是一脉相承的。制宪者们必须掌握土地、财产和公民数量的准确值,因此,他们对这方面的调查非常敏感。考虑到所组建政府的代议制本质,他们尤其需要定期掌握人口和收入方面的变化。比例代表制,即每个公民都应当通过一名当选代表在国民商议中表达其愿望,要求美国政府清楚每个州究竟有多少选民。没有这些数据,就不可能决定每个地区有权选出多少名国会代表,也无法确定每个州应当有多少张选举人票。国家的税收体系也无法加以管理,虽然与以后的年份相比,这一体系还处于初步阶段,却仍然需要对国民财富做出一个评估。
最终,这些制宪者在《美国宪法》中插入了一项条款,它要求每10年进行一次常规的人口普查。这并非是后来才产生的想法。它是面向未来的核心观点,而且几乎是处于文件的开头,在第一条的第二款,仅仅在创建立法分支机构和国会的条款之后:“众议院议员人数和直接税税额应当按照联邦所辖各州的人口数进行分配。人口数应当将所有自由人的数目加总而确定,契约仆役也应计算在内,但应排除未纳税的印第安人。在这个数字的基础上,再加上所有剩余人口数的3/5。实际的人口普查应当在首次国会会议举行后的3年之内进行,以及随后的每个10年期限内,以法律所规定的这种方式完成。”
人们假如能记全这一条款,通常是因为关注它对如何统计奴隶的数量所做的特殊妥协。实行奴隶制的美国南方诸州希望能将奴隶的人数计算在内,以增加总人口数,进而提高在国会的代表数目。北方诸州则表示反对,理由是奴隶们几乎没有法定权利,不能参加投票,因而不能算是真正意义上的合众国公民。这一妥协很有必要,但在美国历史上并不光彩,它将奴隶当作自由人的3/5来加以计算。在接下来的70年里,相对于其选民总人数,南方的势力有所增强,但是最终也未能实现其主人们永久保留南部特殊奴隶制度的意图。
1790年,美国人口普查开展,这是这个新国家的首次官方统计,也是当时联邦政府为了收集有关美国人民的信息,花费最高且耗时最久的举措。当人口不断增长、国民经济活动日益多样化并且规模更大时,这个普查的复杂性和费用也在增长。今天,美国政府仍会每10年进行一次人口普查。第一次普查始于1790年8月的第一个星期一。政府雇用了650名执法官,他们分布在13个殖民地。从收集数据到加以汇总,整个过程持续了18个月,花费达到了45000美元。与之相比,2010年的普查雇用了超过600000名人口普查员,花费了120亿美元,仅仅耗费了几个月的时间,就形成了初步报告,后来又花了不到一年的时间,就向总统及国会提交了庞大的报告。
在所有的官方统计里,人口普查仍然是综合性最强、最广泛和最耗时的一个。在整个19世纪,人口普查逐步发展,远远超越了统计人口数字的内容。托马斯·杰斐逊(Thomas Jefferson)极力想让美国远离给欧洲带来痛苦的战争,而这一点对他建立一个农业国的理想提出了挑战。美国人停止从欧洲进口工业制成品,开始转向国内制造,而这反过来产生了一种需要,即弄清楚美国的产出是多少,正在生产着什么。1810年,美国又增加了有关制造商的一项普查,这是美国人首次试图对迅速成长的工业化局面进行测量。在这数十年里,调查并获得的数据越来越多,从铁路部门雇员人数,到马萨诸塞州制鞋厂的数目,密歇根州家庭平均规模,堪萨斯城的教育水平和文化层次,再到1850年巴吞鲁日自由黑人的数目。
最初这些普查完全依赖于派往全国各地的个人,挨家挨户地进行提问。没有抽样,没有使用任何的统计学方法,也无法核实这些数字的准确性。1790年,调查者的任务是询问每个家庭一些基本问题,而他们要负责一丝不苟地记录下来(当然是手工记录),然后将这些数据带回美国当时的首都费城,制成表格。1850年,美国的版图已经扩展至加利福尼亚这个新州,后勤开始变得更有挑战性。此外,国会命令对从工业到家庭构成的许多新领域展开研究。询问的问题如此之多,海量的信息涌入普查办公室(它在1840年才正式建立),以至于这一机构完全淹没在大量的纸张之中。
由于人口普查有极强的政治敏感性,它在划分国会选区和代表名额方面起着决定性的作用,所以普查办公室在处理信息方面的无能,常常被政敌拿来当作腐败和邪恶意图的证据。这绝不是人们最后一次将政府在统计方面的努力,视为黑暗控制势力的帮凶,认为它通过歪曲真相或是传播谣言,从而让一股势力或另一股势力来控制数百万人的性命。
真相总是平庸的,现实总是乏味的,古往今来都是如此。普查当局对这项工作不胜其烦,它的工作量是如此巨大,甚至可以压倒最为勤勉和专注的人员。19世纪中叶,人口普查当局的职责大大超出了它的能力范围,太多的信息令它不知所措。这些问题在1850年变得愈发严重起来,当时普查的范围再次扩大,包括更多有关奴隶制度的本质,以及奴隶和自由人生活的详尽信息。美国北部和南部、奴隶和自由人之间的冲突正不断加剧,几乎要将这个国家分裂成两半。
来自纽约的辉格党参议员威廉·苏厄德(Whig Senator William Seward)不久之后成为反对奴隶制的共和党创始人之一,而且是林肯战时内阁的核心成员。在他的支持下,1850年的人口普查广泛调查了奴隶的生活。这些问题很容易刺激到某些人的神经,以至于苏厄德遭受了这样的指责:“助推那些将要分裂这个联邦的悲惨的狂热情绪。”这次人口普查的领导约瑟夫·肯尼迪(Joseph Kennedy)则被指控不称职及腐败,雇用的调查者超过了必要数量,为的是帮助他拉拢到更多的支持。民主党所控制的参议院对他展开了调查,指控他存在各种违规行为,包括私自占用位于华盛顿特区的新普查办公室4栋楼中的2栋,并逼迫他辞职。
然而,相比政府信息的极度膨胀,并以及时、准确的方式将它们汇编的特别挑战而言,这一极小的丑闻,仅仅是一个小事件。当然,在奴隶制度上的剑拔弩张,远超过了“有关制表的人是谁,表的内容又是什么”的争论。实际上,美国生活的一个方面奴隶制度是首次被细致且严格地记录下来。从这一意义上来说,有关奴隶制度的数据,可以算是反映美国南部诸州经济生活的首批关键性指标之一。有关出生和死亡、贩运的记录追溯到了17世纪,并且一直保留到了美国南北战争废除奴隶制度的时候。奴隶制度是南部经济的一个重要的部分,而那些记录被用于衡量南北战争爆发之前,南部的财富数量和繁荣程度。
1860年,就在亚伯拉罕·林肯赢得选举及南方诸州脱离联邦之前,最后一次划分奴隶和自由人的人口普查开展。这次人口普查向联邦(the Union)及南部邦联(the Confederacy)提供了有关各自实力的关键信息,包括各自应对战争需要的制造能力。假如这次普查是客观公正的,那么,它证实,在为战争提供补给方面,从枪支、弹药到士兵的制服,北方拥有压倒性的优势。它也证明,尽管南方通过将奴隶当作3/5个人来计算而获得了更多的代表席位,然而在南北战争中它并未得到任何好处。它没有武装这些奴隶,因为很难找到某种方式来调动其积极性,使其为维护奴隶的长久存在而战。
美国的人口普查,是20世纪无所不在的关键性指标的基础。在南北战争之后,尽管有一些州,尤其是马萨诸塞州开始汇编有关工作和劳动力的数据,每10年开展一次的人口普查仍然是有关家庭、生活水平、教育和预期寿命的唯一的国家信息集。第一批的统计学家,以及其他试图描绘国家的状况、探索工业化引发的问题的人,充分挖掘了这些普查报告中所蕴含的丰富信息。
不管怎样,人口普查并非一个统计数值。它也不是一个关键性指标。它是原始数据,海量的原始数据。对于未来的关键性指标而言,它是必要的基础,然而还需要耗费数十年的更多的应用性工作,才能将其数据进行转换。接着,再加入一些东西对其进行扩展,其中既包括针对具体问题的抽样方法,也包括全新的教学理论。
在19世纪美国生活的其他方面,能够用同样的水平加以衡量的,只有贸易额和农业产出。自古以来,农业连同贸易界定着每个社会的运行能力。尽管直到1862年,美国农业部才得以建立,但为了衡量栽种的棉花、烟草、小麦和玉米数量所进行的努力,却可以追溯到18世纪。在19世纪初伊莱·惠特尼(Eli Whitney)发明轧棉机后不久,农业机械化的萌芽出现了。农民们逐渐从收获足够的作物以防止饥荒的古老困扰,转变为种植尽可能多的作物,并且其关注点变成尽可能利用农作物来赚更多的钱。简而言之,农业从满足人们原始需求的必要活动,转变成了一个产业,而这意味着更多地关注于市场、谷物交易、价格的变动,尤其是产量。
没有任何争议的是,直至19世纪末期,农业一直是最为重要的国民经济活动。然而,随着20世纪人们开始聚焦于创造衡量劳动力和产出的指标,在这样的工业化、快速城市化的大跃进中,农业逐渐从国家的舆论和公众意识中淡出。假如你研究一下美国历史,或者是相关的英国历史和欧洲历史,就会发现除了散落在各处的一些参考信息之外,有关农业和耕作的内容少得可怜。杰斐逊想要建立一个属于自耕农的国家,亚历山大·汉密尔顿(Alexander Hamilton)则致力于工业、城市和金融的发展,两人之间的争论,你可以有所感受。不过,以农作物为中心的内容,比如有关土地是种满作物还是休耕、土壤科学以及为产出食物而进行的土地改良方面的信息,大多数都已经遗失,并且看起来很遥远。当然,如果你是在艾奥瓦州和内布拉斯加州这样的农业州长大的,那么情况可能会有所不同。
不过,在19世纪的大多数时间里,了解农场正在发生什么事情,对于美国能否繁荣颇为关键。在英国人建立的“农业社会”的基础上,在19世纪最初的数十年里,美国的各州开始调查农场产出,而马萨诸塞州是典型的领路人。1840年,对农业进行了首次初步调查,随后在1862年美国农业部成立了。同年,美国还颁布了《宅地法》(Homestead Act),这一法案开启了移居和开垦美国西部的宏伟事业。在历史上具有讽刺意味的一个小事件是,美国农业部的创立在当时被誉为通过科学的观察和计算,迈向更优政策和更高产出的重要一步,而它的第一任长官名叫艾萨克·牛顿。
尽管人口普查中包括了一些与农作物相关的信息,但这个新部门在收集农业信息方面则走得更远。这个部门拥有庞大的统计职员,还有第一批定期去欧洲旅行,并与伦敦、巴黎、柏林和维也纳的同行会晤的特派员。他们分享彼此在工作中采用的方法与途径,而这代表了各国首次做出的超越国界的共同努力之一:为了衡量和交流共同面临的社会挑战,而建立起共同的应对方法。20世纪中叶,这些经济指标从西方政府所使用的工具,转变为世界上每个国家用以评估国民幸福程度的度量指标,这种局面完全源自各国不间断的合作。我们应当看到,联合国在聚集各国政府的专家,以及随后在全球范围内散播这一信息方面,起到了关键的作用。19世纪的农业统计可谓是当代关键性指标的先驱。
通过这些统计数据,我们也可以领略到,想要真实地衡量这个世界有多难。人口普查在雇用职员方面花费不菲,主要是因为它需要在全国各地派出职员去询问问题。即使这样,这其中还是出了许多的错误。美国农业部和它的统计部门依靠样本来获取信息,但是相对于后期统计学家的标准而言,它们缺乏任何的“抽样方法”。它们依靠各个州立机构所收集的数据,但是每个州都有它自己的一套优先顺序,而且各州统计资料的质量和数量变化极大。19世纪中叶,这个部门依赖于几百个机构,而到了19世纪末,则变成了数千个。即使这个数量也远远不够。光靠几千个机构,是无法深入美国每一个农场的,而且即使它们能够找到方法,也会受到访问时间的限制。假如它们是在冬天拜访,田里会空空如也,而调查者就不得不完全依靠农民告诉他们的信息,来完成调查工作。在春天,调查者只能统计种下的种子数量,而非收获的庄稼有多少。气候模式也可能显著地改变估计值,直到今天也依然如此。而且,有些农民害怕政府向他们征收更高的税,或者仅仅是不相信政府,还会少报农作物的数量。到20世纪时,为防止供给过多,从而导致价格的走低,政府会向农民付款而让他们不种植农作物,由此产生的一些联邦的新项目又激励了农民多报农作物数量。不管是哪种方式,都证实了农业数据很难获得,数据质量不可靠,而且一贯不准确。
雅各布·道奇(Jacob Dodge)是美国农业部任职多年的首席统计学家,他在19世纪80年代观察到:“一条溪流不可能上升到比其源头更高的位置;纯粹数学和完美判断的联合,也无法彻底解决错误的原始数据引发的不准确性。无论是一次需要花费数年时间和数百万金钱的人口普查,还是其他任何官方或非官方的农作物调查,都是今天要获得正确统计结果所面临的最大困难。”几乎自官方统计开始的时刻起,试图通过数据来描绘一幅有关世界的完美地图,总是会因为实际汇编数据的缺乏而功亏于溃。从那时起,关键性指标的编制者一直在艰难地前行,不断地加以改进和完善,从过去的失误中汲取教训,发展新的数学理论和新的抽样方式,并且利用每一代的新技术来捕捉和分析更多的数据。他们过去知道,现在也依然明了问题和瑕疵所在。不过,在20世纪,当这些数字脱离了汇编它们的无名的官方机构,出现在政治和社会的聚光灯下的时候,公众对于简单的要求,超越了这些统计数据所代表的无尽的复杂性。在确定这一年的玉米或者牛肉的价格时,金融市场不想知道有关农作物和牲畜的报告存在哪些方法论方面的局限。在考虑通货膨胀率和由国内生产总值所衡量的经济增长时,政治家们也对抽样误差或是多年的数据修正不感兴趣。他们想要的只是一个数字,并且想让它成为“事实”,或者至少是真实状况的极佳代表。
然而,尽管与那些为了收集信息而刻苦工作的人的雄心壮志并不相称,但比起完全没有任何统计资料,19世纪末和20世纪初的统计资料还是明显要好得多。和没有任何信息相比,不准确的信息也是一大进步,这一点不可否认。就像与现代的GPS定位系统相比,早期的导航设备存在着缺陷,但是比起光凭眼睛和天空来航行,它还是更为可取一些。最早的时候,所有的社会一直盲目行动、瞎猜各自国家的实力和资源存量,最多做做计数和加法,比起当时所处的阶段和虚无的方式,正式形成经济指标的第一次尝试,给政府和市场提供了提前计划和评估优势与劣势的有力工具。
然而,在19世纪最后数十年,社会的急剧变化,成为推动社会获取更多经济和社会生活方面信息的动力。对于更多数据和新统计资料的这种需求,并非源于因经济繁荣而产生的对实力的感知,而是出于这样一种强烈的感觉:经济上的不平等正在扩大,社会正义正在削弱,工业化步伐带来的伤害,和它带来的益处一样多。不管怎样,为了证实那一点,需要相关的数据,而非仅仅是意识形态和一些好的论点。人们最想获得的数据并不只是食物,还有工作。