拆穿数据胡扯
上QQ阅读APP看书,第一时间看更新

推荐序2
拨开胡扯的迷雾

姚利芬 中国科普研究所创作研究室副研究员

哲学家哈里·法兰克福在其著作《论胡扯》中称:在我们的文化里,有太多的人在“胡扯” (bullshit)。在某种意义上,“胡扯”比“说谎”对我们的危害性更大。说谎的人知道何者为真,讲的却是假话。胡扯的人既不关心何者为真,也不关心何者为假,只在乎自身利益。然而,什么是胡扯?胡扯的存在形式是什么?如何发现胡扯?这些问题一直困扰着我们。这些问题犹如问我们什么是时间一样,“如果没有人问我,我是明白的;如果我想给问我的人解释,那我就不明白了”。

幸运的是,这本书对此给出了试探性的回答。

很多人认为自己很容易发现胡扯,因为胡扯常以花哨的语言形式出现。然而,本书重点并非研究这种老派胡扯,而是研究新派胡扯。新派胡扯试图用数学和统计语言来营造严谨性、准确性,试图给胡扯披上“科学”的外衣。为什么新派胡扯总是利用数字、统计数据和数据图表粉饰那些可疑的论断,给它们披上了一层合理的外衣呢?本书作者没有对此进行研究。在我看来,这是近代以来对自然的数学化造成的。自然的数学化的本质并非是使用数学的语言描绘大自然和人类社会,而是把整个世界看成是使用数学的。在西方,这种传统由来已久,起源于毕达哥拉斯–柏拉图传统,他们认为数学或者理念是世界的本质。在近代,伽利略宣称大自然这本书是用数学写成的。因此,哪个学科越能用数学的语言进行描述,哪个学科就越“科学”,也就越不容置疑。这就解释了本书作者发现的一个现象:“在人文和社会科学领域,学生们被教导要让相互冲突的观点相互碰撞,要与不一致的观点做斗争;但在STEM领域,学生们解决悖论、调和相互矛盾的证据、批判错误论断的机会非常少。”无论如何,新派胡扯不那么容易被人发现,我们经常被种种数学化的形式所“忽悠”。不过,阅读此书会帮助我们快速而准确地辨别出这些新派胡扯。

这本书逻辑清晰、语言优美,很多地方论述得十分精彩。印象最深的是第4章,即因果关系,这也是揭示新派胡扯十分关键的一步。虽然书中没有明确提出,但我认为作者是通过以下几个方面论述因果关系中的胡扯的。

首先,把相关性当成因果关系。毫无疑问,因果关系是某种关联,但并非有关联的两个事物都存在因果关系。暴风雪来临之前,气压计读数会产生变化,但我们不认为气压计的读数的变化导致了暴风雪的来临。虽然两者看似有先行后续的联系,但这种联系并非因果关系。其实,气压的变化导致了气压计读数的变化,也导致暴风雪的来临。也就是说,暴风雪和气压计读数的变化有一个共同原因,它们之间却没有因果关系。新派胡扯经常把联系说成存在因果关系,以达到胡扯者的其他目的。在作者看来,虽然结婚率与自杀率有关,但这并不意味着婚姻会导致自杀。因此,我们不要看到数据显示相关性,就草率地认为存在因果关系。

其次,因果倒置。我们通常用旗杆的长度解释旗杆的影长,这是因为旗杆是产生旗杆影长的原因。反之,那简直就是胡扯。本书中也提到了这种因果倒置的胡扯形式。伟大的统计学家之一罗纳德·费希尔试图证明,吸烟不会导致肺癌,而是肺癌导致吸烟。他的理由是,肺癌导致患者不适,而吸烟可以缓解这种不适。

再次,凭借错误的假设推导出因果关系。本书中给我们提供了如下例子。据心理学家斯科特·盖勒和同事研究,买扎啤的学生喝的啤酒数量大约是买杯装和瓶装啤酒的学生的2~4倍。但是,随着时间推移,这一论断也发生了变化。“如果喝扎啤,就会喝得更多”被理解为“人们喝得更多是因为他们喝的是扎啤”。因此,“我们应该禁售扎啤,这样学生们就会少喝酒”。毫无疑问,这也是一种胡扯。

最后,在一些伪相关性中寻找因果关系。作者说,有的关联性无关紧要,甚至不值一提,在这些关联性中寻找因果关系简直是一种胡扯。例如,在美国小姐的年龄与被水蒸气、热蒸气等高温物体谋杀的人数关联中寻找因果关系,简直就是不折不扣的胡扯。

如何解决涉及因果关系的胡扯呢?作者给出的方法是人为操控。虽然作者没有明确指出,但从这里也可以看出作者想利用因果关系的操控理论来解决此问题。因果关系的操控理论种类繁多,不过哲学家詹姆斯·伍德沃德提出的理论能被大多数人所接受。虽然新派胡扯总是利用数字、统计数据和数据图表等形式,但本书没有或许会让读者眼花缭乱的方程式,通篇充溢着幽默感,读起来轻松愉悦。在这种阅读气氛中,读者不知不觉学会了如何发现和拆穿胡扯、驳斥谎言的策略。