人人都在说谎:赤裸裸的数据真相
上QQ阅读APP看书,第一时间看更新

第一部分
大数据,小数据

1 你的直觉出错了

如果你已经33岁,连续参加了好几个感恩节派对都没有带伴侣,那大家就会开始关心你的择偶问题了。几乎每个人都有自己的看法。

“赛思应该找一个疯女孩,和他一样。”我姐姐说。

“你疯了吧!他该找个正常的女孩,和他互补。”我弟弟说。

“赛思才不疯呢。”我母亲说。

“你是真疯了!赛思当然很疯!”我父亲说。

说话温柔又腼腆的祖母在整个晚餐过程中一言未发,此刻却突然发话了。在座的纽约人瞬间噤声,所有人的目光都集中在这个留着黄色短发、带着一丝东欧口音的小老太太身上。“赛思,你得找个好姑娘。她不用很漂亮,可得聪明伶俐,待人友善;她得懂社交应酬,这样你才能专心做自己的事;她得有幽默感,因为你也是个有趣的人。”

为什么这个老太太的建议会受到全家人的关注和尊重呢?88岁高龄的祖母比餐桌上其他人都见多识广。一直以来,她关注过许多婚姻,有成功的,也有不成功的。在过去的几十年里,她把成就幸福婚姻的特质做了分类。于是,就在这个感恩节餐桌上,针对择偶问题,祖母开始在她巨大的数据点集里搜寻答案。我的祖母就是一个大数据。

在本书中,我想简化数据科学。不管我们是否喜欢,数据正在我们的生活中扮演越来越重要的角色——其影响力将会越来越大。如今的许多报纸总有整版整版的内容在谈数据,许多公司都拥有专门负责数据分析工作的团队,许多投资人都愿意拿出几千万美元投资持有更多数据的创业公司。即使从未学过如何进行回归分析(社会科学家用来梳理多种因素影响的方法)或计算置信区间,你也会遇到大量数据——读书时会遇到,参加商务会议时会遇到,去饮水机那儿接水时听到的办公室八卦中也会遇到。

许多人对这一发展感到不安。他们惧怕数据,很容易在这个数字的世界中迷失自我,手足无措。他们觉得这种对世界的量化认知是少数左脑发达的天才的事,与他们无关。一旦碰到数字,他们就立马翻页、结束会议或转移话题。

我从事数据分析工作已有10年,且有幸同该领域的许多“大咖”合作过。在此期间,我学到的最重要的一课便是:好的数据科学远没有人们想象的那么复杂。事实上,最好的数据科学便是一种出乎意料的直觉。我指的是我熟悉的数据分析领域的知识,即尝试解释并预测人类行为的数据科学,而非类似无人驾驶技术等人工智能。尽管这些方法确实使用从人脑中发现的各类工具,却并不容易理解。

为什么数据科学可以凭直觉感知呢?数据科学的核心在于发现不同模式以及预测一个变量如何影响其他变量。人们一直在做这类事情。

只需看看我祖母给出择偶建议的方式就会明白这一点。她利用了自己大脑中的情侣关系大数据库,这个数据库在她近百年的生命中持续更新,包括她从她的家人、朋友及熟人那里听到的许多故事。首先,她把自己的分析限定在某个情侣关系样本中,这个样本中的男性和我有着很多共同特质——敏感、孤僻、幽默;其次,她把目光锁定在女性的重要特质上,比如是否善良、是否聪明、是否漂亮;再次,她把女性的这些重要特质和前述情侣关系中的某个重要特质联系起来,看看是否合拍;最后,她得出自己的结论。换句话说,她辨识出许多模式并且预测一个变量如何影响其他变量。我的祖母就是一位数据科学家。

你也是数据科学家。小时候,你注意到自己一哭,妈妈就会关注你,这就是数据科学。成年后,你发现如果总是抱怨,人们就会渐渐疏远你,这也是数据科学。当人们渐渐疏远你时,你会发现自己越来越不开心。当你越来越不开心时,就会变得越来越不友善。当你变得越来越不友善时,人们就更不愿意和你来往了。数据科学!数据科学!还是数据科学!

因为数据科学太出于本能了,所以我发现,几乎任何一个聪明点儿的人都可以理解最好的大数据研究。如果你无法理解某项研究,那问题或许在于研究本身,而不是你。

想要证明大数据科学的直觉性倾向吗?最近,我偶然发现一项研究,这项研究算得上过去几年展开的最重要的研究之一了,也是我见过的最具直觉性的一项研究。我想让你考虑的不仅是这项研究的重要性,而且包含其体现的本能和直觉特性。

该研究是由哥伦比亚大学和微软共同组成研究团队携手推进的。该团队希望发现什么样的症状可以预示胰腺癌。John Paparrizos, Ryan W. White, and Eric Horvitz,“Screening for Pancreatic Adenocarcinoma Using Signals from Web Search Logs: Feasibility Study and Results,”Journal of Oncology Practice (2016).这种癌症的存活率极低(只有3%的概率能活过5年),但如果发现得早,患者的存活率就会翻番。

研究人员用了什么办法呢?他们利用了必应和谷歌搜索引擎内数万名匿名用户的数据信息。他们总能锁定近来刚被确诊为胰腺癌患者的用户,因为这些用户曾有过明确的搜索,比如“刚刚被确诊为胰腺癌”或“医生说我患胰腺癌了,我还能有什么指望”。

接下来,研究人员对健康症状的搜索进行了研究,他们选取了少量后来被确诊为胰腺癌患者的用户和那些未被确诊的用户进行对比。那么,在短短几周或几个月内,什么样的症状可以预示一个用户将会被确诊为胰腺癌患者呢?

结果令人惊讶。事实证明,先后搜索“背部疼痛”和“皮肤发黄”这两个词条的用户最终都被确诊为胰腺癌患者,而只搜索“背部疼痛”的用户则不太可能得这个病;同样,搜索“消化不良”和“腹痛”这两个词条的用户都被确诊为胰腺癌患者,而只搜索“消化不良”则意味着此人不太可能罹患此病。研究人员可以识别5%~15%的案例,几乎没有误报。尽管这也许算不上很大的概率,但如果你是胰腺癌患者,即便只有10%的概率可以使你的存活率翻番,也算是上天的恩赐了。

详述该研究的论文对非专业人员来说可能就比较晦涩难懂了。论文中包含大量专业术语,比如KS –检验(Kolmogorov-Smirnov test),不得不承认连我都忘记它是什么意思了。(这是判断一个模型是否和数据准确匹配的方法。)

然而,请你注意,这项重要的研究从根本上来说是具有极强的本能性和直觉性的。研究人员研究了各种各样的医疗案例,并尝试将症状与特定疾病联系起来。你知道还有谁使用这种方法来弄清楚某人是否患了某种疾病吗?伴侣、父母,以及医生和护士。根据经验和知识,他们将发热、头痛、流鼻涕、胃痛等症状和各种疾病联系起来。也就是说,哥伦比亚大学和微软的研究人员通过利用每个人用来做健康诊断的自然且显而易见的方法,撰写了一篇具有开创性的研究论文。

先别急,咱们慢慢来。如我所说,如果最好的数据科学的方法通常既具有本能性又具有直觉性,那么一个关于大数据价值的根本问题就来了。如果人类天生就是数据科学家,如果仅凭直觉就能研究数据科学,那么为什么我们还需要电脑或统计软件呢?为什么我们还需要KS –检验呢?我们就不能相信直觉吗?不能像祖母那样,不能像医生或护士那样吗?

马尔科姆·格拉德威尔(Malcolm Gladwell)的畅销书《眨眼之间》(Blink)发行后激发了人们对上述问题的讨论。该书极力赞扬人类直觉的魔力。格拉德威尔在书中举了许多例子:一个人仅凭自己的直觉就可以辨别一座雕像是真是假,网球运动员在打到球之前是否会出差错,消费者愿意花多少钱,等等。《眨眼之间》里的主人公们没有人做回归分析或计算置信区间,也没有谁进行KS –检验,但他们通常都能做出准确的预测。许多人不由自主地支持格拉德威尔为直觉的辩护:他们相信自己的直觉和感觉。《眨眼之间》的“粉丝”或许要为我的祖母欢呼鼓掌了,因为她未借助电脑就为我提出了择偶建议;而对于我的研究和本书中其他借助电脑展开的研究,他们恐怕就不以为然了。如果说大数据(我说的是和电脑有关的大数据,不是我祖母那种)是一次革命,我们就得证明它比格拉德威尔所“神化”的直觉更具说服力。

哥伦比亚大学和微软的研究提供了严谨的数据科学与电脑相结合的明显例证,该例证告诉我们有些事仅凭直觉是永远无法了解的。这个例子也说明数据集大小的重要性。有时候我们的经验不足,无法通过直觉得出结论。你(或你亲密的朋友或家人)似乎不太可能见过足够多的胰腺癌病例,更不可能以此辨识消化不良伴随腹痛的症状和纯消化不良症状之间的差别。事实上,随着必应数据集的不断增大,研究人员在症状辨识(不仅限于这一种疾病)上会发现更多微妙的模式,即使是医生也有可能忽略这些模式的存在,这是不可避免的。

此外,尽管直觉也许常常让我们感觉很了解这个世界的运作方式,但这种感觉往往是不确切的。我们需要用数据使其清晰化。以天气影响心情为例。你可能会猜测,和70华氏度(约21摄氏度)相比,人们在10华氏度(约零下12摄氏度)的低温下更容易感到失落。其实,这种猜想是对的,但你可能猜不到这种温差产生的影响有多大。我查询过一个地区有关抑郁的谷歌搜索与很多因素(包括经济状况、教育水平和教堂活动参与度)之间的关联性。冬季气候产生的影响最为明显。关于这项研究的讨论参见Seth Stephens-Davidowitz,“Dr. Google Will See You Now,”New York Times, August 11, 2013, SR12。冬天,在温暖的夏威夷檀香山,抑郁的相关搜索频率比在寒冷的伊利诺伊州芝加哥低了40%。这个效果有多么显著呢?乐观地说,药效最佳的抗抑郁药物也仅能使抑郁症的发生率降低约20%。依据谷歌的数据判断,从芝加哥搬到檀香山对治疗“冬季抑郁”的功效可比药物治疗高出整整一倍啊。大爆料:完成这项研究之后不久,我就从加利福尼亚搬到了纽约。使用数据来学习你应该做什么通常很简单,但做起来实在太难了。——作者注

如果没有电脑精确分析的引导,我们的直觉有时甚至会犯下致命大错。我们可能会被自己的经历或偏见蒙蔽双眼。事实上,尽管我的祖母可以凭借她多年的经验给出比其他家庭成员更好的择偶建议,但对于是什么让爱情得以延续这一问题,她的观点依然是没有说服力的。比如,她总是跟我强调有共同好友的重要性。她相信她婚姻成功的一大秘诀是:几乎每个傍晚都和丈夫(也就是我的祖父)闲坐在纽约皇后区家中后花园里的草坪躺椅上,八卦着左邻右舍的鸡毛蒜皮。

尽管要冒着让我的祖母当替罪羊的风险,但数据科学的确证明祖母的理论错了。最近,一个计算机科学家团队对人类关系中最大的数据集脸谱网进行了分析。Lars Backstrom and Jon Kleinberg,“Romantic Partnerships and the Dispersion of Social Ties: A Network Analysis of Relationship Status on Facebook,” in Proceedings of the 17th ACM Conference on Computer Supported Cooperative Work & Social Computing(2014).他们观察了大量关系在某一时刻显示为“恋爱中”的伴侣,其中部分伴侣始终保持“恋爱中”的状态,而其他伴侣则将自己的状态改成了“单身”。该调查表明,有共同的好友圈其实是一个强预测器,预示着一段爱情长不了!也许每晚都和伴侣及一小撮固定的朋友闲逛真算不上一件好事,各自独立的社交圈也许才有助于巩固两性关系。

正如各位所见,在没有电脑帮助的情况下,我们的直觉有时确实让人眼前一亮,但直觉有可能酿成大错。我的祖母可能陷入了一个认知的泥沼:我们倾向于夸大个人经验的作用。用数据科学家的话说就是,我们总会给自己的数据加权,总是过于重视一个特别的数据点——我们自己。

因为祖母过于关注和祖父的饭后闲聊以及他们共同的朋友,所以很少考虑其他夫妻的情况。她完全忘记了她的妹妹和妹夫也总是在晚上聊起他们那一小撮共同好友,可仍然经常吵架,最后以离婚收场。她也完全忽略了我的父母(她的女儿和女婿)的婚姻状况。我的父母各有各的去处——父亲和朋友一起去爵士酒吧或去看球,母亲则和朋友出门吃饭或去剧院,他们的婚姻依然幸福美满。

人类总是痴迷于戏剧性的事情,依靠直觉时,我们还有可能为这种本性所误导。我们总会高估所有令人印象深刻的事物的作用。比如,一项调查显示,人们一致认为龙卷风致死人数多于哮喘Daniel Kahneman, Thinking, Fast and Slow (New York: Farrar,Straus and Giroux, 2011).,但事实上,因哮喘失去生命的人数是因龙卷风失去生命人数的70倍。1979—2010年,年均有55.81名美国人死于龙卷风袭击,4 216.53名美国人死于哮喘。参见Annual U.S. Killer Tornado Statistics,National Weather Service, http://www.spc.noaa.gov/climo/torn/fatalmap.php和Trends in Asthma Morbidity and Mortality, American Lung Association, Epidemiology and Statistics Unit。因为哮喘致死人数不突显,也不会上新闻,而龙卷风会。

换句话说,当我们凭借自己的亲耳所闻或亲身经历来判定这个世界的运作模式时,通常都会出错。虽然最好的数据科学方法通常是具有直觉性的,但其结果多是反直觉的。数据科学采用既具本能性又具直觉性的人工流程(先发现模式,而后理解其内涵)并向其中注入更多功能,这样我们可能会看到这个世界的运作方式与我们之前想象的完全不同。这就是我在研究篮球运动员成材率的预测指标时所发生的事。

当我还是个孩子的时候,曾经有过一个梦想,也是唯一一个梦想:我长大了要当一名经济学家和数据科学家。不不,我不过是开个玩笑罢了。那时我其实超想做个职业篮球运动员,追随我的偶像——纽约尼克斯队前全明星中锋帕特里克·尤因(Patrick Ewing)的步伐。我最喜欢的有关尤因的视频集锦是“Patrick Ewing’s Top 10 Career Plays,” YouTube video, posted September 18, 2015, https://www.youtube.com/watch?v=Y29gMuYymv8和“Patrick Ewing Knicks Tribute,” YouTube video, posted May 12, 2006, https://www.youtube.com/watch?v=8T2l5Emzu-I。

我有时候怀疑每个数据科学家的心中都有一个孩子,这个孩子一直在努力弄明白为什么他儿时的梦想没能实现,所以最近我做了一项关于“如何才能进入NBA(美国男子职业篮球联赛)”的调查,这也就不足为奇了。调查的结果出乎意料。事实上,这些结果再次证明了好的数据科学可以改变我们的世界观,也证明了数据和人类直觉有多么不一致。

我特别关注的问题是这样的:是在贫穷家庭长大的孩子更有可能进入NBA,还是在中产阶层家庭长大的孩子更有可能?

大多数人会猜测是前者。传统观念认为,在困境中(比如由单身的未成年母亲抚养)成长有助于培养必要的驱动力,以达到这一竞争激烈的体育运动的顶级水平。

费城一所高中的篮球教练威廉·埃勒比(William Ellerbee)在接受《体育画报》(Sports Illustrated)采访时表达了这一看法。“郊区的孩子打篮球往往是为了玩乐,”埃勒比说,“而内城的孩子则把篮球看作生死攸关的事情。”S. L. Price,“Whatever Happened to the White Athlete?”Sports Illustrated , December 8, 1997.唉,我在新泽西郊区长大,生活在父母双全的家庭;而当代最好的球员勒布朗·詹姆斯(LeBron James)却生在俄亥俄州阿克伦,由一位贫穷的16岁单身母亲抚养成人。

事实上,我发起的一项互联网调查表明,大多数美国人与我和埃勒比教练的想法是一样的:大多数NBA球员都出身寒门。这是我在2013年10月22日进行的谷歌消费者调查。我的问题是:“你认为大多数NBA球员的出生地是哪里?”两个选项分别为“贫民区”和“中产阶层区”,59.7%的受访者选择了“贫民区”。

这个传统观念是否正确呢?

我们来看看数据是怎么说的。虽然没有NBA球员社会经济学的综合数据来源,但是通过数据分析,通过利用大量资料源(篮球数据网站basketball-reference.com、族谱网站ancestry.com、美国人口普查等数据),我们可以弄清楚什么样的家庭背景最有利于一名篮球运动员进入NBA。你会发现,这项研究所覆盖的数据源十分广泛,有的十分庞大,而有的则比较小;有的来源于线上,有的则来源于线下。有的新数据源实在令人振奋,如果它们能帮上忙,一名优秀的数据科学家是不会只参考那些旧数据源的。获得答案的最佳方式是将所有可用数据都结合起来。

第一个相关数据就是每名运动员的出生地。我记录了20世纪80年代美国每个县出生的黑人男孩和白人男孩的数量。随后,我又记录了其中有多少人成功进入了NBA。我将这一数字和每个县的平均家庭收入做了对比,还掌握了各县的种族人口统计数据(这是另一本书的主题),最后我发现黑人进入NBA的可能性比白人大40倍。

数据显示,如果一个孩子出生在富裕的县,他就有更多的机会进入NBA。例如,一个在美国最富裕的县出生的黑人孩子,与一个在美国最贫穷的县出生的黑人孩子相比,进入NBA的机会要多出两倍多;而对一个白人孩子来说,若出生在最富裕的县,其进入NBA的概率比出生在最贫穷的县大60%。

这些数据表明,与人们的普遍看法不同,NBA中出身贫寒的运动员实际上数量极少。然而,这个数据并不完美,因为美国许多富裕的县、区,如纽约(曼哈顿),也有许多类似哈勒姆这样的贫困区。所以,艰苦的童年仍有可能帮助你进入NBA。我们还需要更多的线索、更多的数据。

于是,我又调查了NBA球员的家庭背景。这些信息是从新闻报道和社交网络中找到的。这种方法相当耗时,所以我把分析限定在20世纪80年代出生的100个得分最高的非洲裔球员中。与美国的普通黑人相比,NBA超级明星球员中有未成年母亲或未婚母亲的比例低了约30%。也就是说,最杰出的NBA黑人球员的家庭背景表明,舒适的成长环境更有利于获得成功。

尽管如此,不论是县级的出生数据还是作为特定样本的那些球员的家庭背景都无法提供所有NBA球员童年的完美信息。所以,我还不能完全相信与单亲家庭及贫困家庭相比,在双亲的中产阶层家庭中会诞生更多NBA球星。在这个问题上,我们提供的数据越多越好。

后来我又想起了一个数据点,这个数据点可以为个人背景调查提供有效线索,是由罗兰·弗赖尔(Roland Fryer)和史蒂芬·列维特(Steven Levitt)这两位经济学家在一篇论文中提出的——黑人的名字能够体现其社会经济背景。Roland G. Fryer Jr. and Steven D. Levitt,“The Causes and Consequences of Distinctively Black Names,”Quarterly Journal of Economics 119, no. 3 (2004).弗赖尔和列维特早在20世纪80年代就在加利福尼亚州对人们的出生证明做过研究,他们发现,在非洲裔美国人中,贫穷、未受过教育的单身母亲倾向于给孩子起一个不同于受过教育的中产阶层已婚父母给孩子起的名字。

富裕家庭的父母倾向于给孩子取一个常见的名字,如凯文、克里斯和约翰,而那些贫困家庭的单身母亲则更有可能给孩子取一个独特的名字,如诺肖恩、尤尼克和布雷昂谢。出身贫寒的非洲裔美国孩子得到一个标新立异的名字的概率接近同年出生的其他孩子的两倍。

那么NBA球员的名字又是什么样的呢?是更像中产阶层家庭出身还是更像在贫寒人家长大的呢?还是以20世纪80年代为例,在加利福尼亚州出生的NBA球员中有一半的人和一般黑人男性一样拥有特别的名字,这是统计上的显著差异。

总有人认为NBA是属于贫民窟那帮孩子的联盟,你认识这样的人吗?让他仔细听听下一场比赛的广播,注意一下是不是常常听到“拉塞尔运球躲过德怀特,试图将球滑过约什伸出的手臂,最后传到凯文的手中”。如果NBA真的是出身贫寒的黑人的联盟,那他听到的可能大不相同,肯定会有更多人取一个像勒布朗这样的名字。

截至目前,我们已经搜集了三份不同的证据:出生地、得分王母亲的婚姻状况和球员的名字。三份证据都不够完美,但都印证了相同的结果——社会经济地位越高,意味着进入NBA的可能性就越大。也就是说,传统的观念是错误的。

20世纪80年代,约有60%的非洲裔美国人出生时父母处于未婚状态。Centers for Disease Control and Prevention,“Health, United States, 2009,” Table 9, Nonmarital Childbearing, by Detailed Race and Hispanic Origin of Mother, and Maternal Age: United States,Selected Years 1970–2006.据我估计,在那10年里出生并且进入NBA的非洲裔美国人中,绝大多数人的父母都处于已婚状态。换句话说,NBA中身世背景像勒布朗·詹姆斯那样的人并不多,更多的人像克里斯·波什(Chris Bosh)一样——由得克萨斯州的一对夫妇抚养长大,父母从小培养了他对电子产品的兴趣,或者像克里斯·保罗(Chris Paul)一样,他是北卡罗来纳州刘易斯维尔市一对中产阶层夫妇的二儿子,2011年,他和他的家人还一起参加了《家庭问答》(Family Feud)节目。“Not Just a Typical Jock: Miami Heat Forward Chris Bosh’s Interests Go Well Beyond Basketball,” Palm Beach Post.com,February 15, 2011, http://www.palmbeachpost.com/news/sports/basketball/not-just-a-typical-jock-miami-heat-forward-chris-b/nLp7Z/; Dave Walker,“Chris Paul’s Family to Compete on ‘Family Feud’,” nola.com, October 31, 2011, http://www.nola.com/tv/index.ssf/2011/10/chris_pauls_family_to_compete.html.

数据科学家的目标是了解世界。一旦发现了反直觉性的结果,我们就可以运用更多的数据科学知识来解释为什么世界并非我们看到的那样。例如,为什么出身中产阶层家庭的人打篮球比出身贫困家庭的人更具优势?原因至少有两个。

第一个原因是穷人往往个子比较矮。很早以前,学者就知道童年时期的医疗保健和营养补给会对成年后的健康状况产生重要影响。这就是现在发达国家普通人的平均身高比一个半世纪前高4英寸(约10厘米)的原因。“Why Are We Getting Taller as a Species?”Scientific American,http://www.scientificamerican.com/article/why-are-we-getting-taller/. 有趣的是,美国人的个头不再增高了。Amanda Onion,“Why Have Americans Stopped Growing Taller?” ABC News, July 3,2016, http://abcnews.go.com/Technology/story?id=98438&page=1.我曾经认为,NBA外籍球员数激增的原因之一就是其他国家的球员与美国球员的身高差距在不断缩小。1946—1980年,美国人的身高不断增长,因此NBA联盟中出生于美国、身高7英尺的球员人数增长了16倍。在美国人不再长个儿后,这一数值开始趋于平稳。与此同时,身高7英尺以上的外籍球员数量则大量增长。我发现,国际球员人数增长最多的一直是来自各国的超高球员,他们大多来自土耳其、西班牙和希腊,这些国家近年来对儿童健康和成人身高的关注度显著提高。数据表明,由于童年时期医疗保健条件差且营养不良,家庭贫困的美国人普遍较矮。Carmen R. Isasi et al.,“Association of Childhood Economic Hardship with Adult Height and Adult Adiposity among Hispanics/Latinos: The HCHS/SOL Socio-Cultural Ancillary Study,”PloS One 11, no. 2 (2016); Jane E. Miller and Sanders Korenman,“Poverty and Children’s Nutritional Status in the United States,”American Journal of Epidemiology 140, no. 3 (1994);Harry J. Holzer, Diane Whitmore Schanzenbach, Greg J. Duncan,and Jens Ludwig,“The Economic Costs of Childhood Poverty in the United States,”Journal of Children and Poverty 14, no. 1 (2008).

数据还可以告诉我们身高对进入NBA的影响。仅凭直觉你也一定会知道,身材高大可以让一个有抱负的篮球运动员如虎添翼。将球场上普通球员的身高与看台上普通男性球迷的身高做个对比,就会明白这一点。NBA球员的平均身高约为6英尺7英寸(约200厘米),普通美国男性的平均身高约为5英尺9英寸(约175厘米)。Cheryl D. Fryar, Qiuping Gu, and Cynthia L. Ogden, “Anthropometric Reference Data for Children and Adults: United States,2007–2010,”Vital and Health Statistics Series 11, no. 252 (2012).身高有多重要呢?NBA球员有时会谎报自己的身高,反正也没有美国男性身高分布的完整记载。如果对这个身高分布做一个粗略的数学估算,再看看NBA的球员身高数据,很容易就可以确定身高的巨大影响,其影响也许比我们预想的还要大。据我估算,身高每增加1英寸(2.54厘米),进入NBA的概率便会翻番。这个规律适用于所有美国男性。身高5英尺11英寸(约180厘米)的男子进入NBA的概率是身高5英尺10英寸(约178厘米)的男子的两倍,身高6英尺11英寸(约211厘米)的男子进入NBA的概率是身高6英尺10英寸(约208厘米)的男子的两倍。数据还显示,在身高不足6英尺(约183厘米)的男性中,每200万人中大约只有一人能进入NBA;而在身高超过7英尺(约213厘米)的人中,据我和其他人估计,每5人中就有一人可以进入NBA。Pablo S. Torre,“Larger Than Real Life,”Sports Illustrated, July 4,2011.

这下你知道了吧,数据证实了我的“球星梦”幻灭的原因——不是我在郊区长大,而是我只有5英尺9英寸高,还是个白人(更别提速度慢了)。况且,我还很懒;体力不好;投篮姿势糟糕;球到了我的手上,我还不时会紧张得要死。

来自贫困家庭的孩子很难进入NBA的第二个原因,是他们有时缺乏一定的社交技能。通过对数千名学龄儿童的数据研究,经济学家发现,一般来说,中产阶层的双亲家庭培养的孩子更可靠、更自律、更执着、更专注,也更有组织性。Tim Kautz, James J. Heckman, Ron Diris, Bas Ter Weel, and Lex Borghans,“Fostering and Measuring Skills: Improving Cognitive and Non-Cognitive Skills to Promote Lifetime Success,” National Bureau of Economic Research Working Paper 20749, 2014.

那么,社交技能的匮乏是如何让一份前景看好的篮球事业偏离正常的发展轨道的呢?

我们来看看道格·伦(Doug Wrenn)的故事,他曾被视为20世纪90年代最有职业前途的球星之一。他的大学教练,康涅狄格大学的吉姆·卡尔霍恩(Jim Calhoun)教练(他曾经训练过多位未来的NBA球星)称道格·伦是所有曾经与他合作过的人中跳跃能力最强的。Desmond Conner,“For Wrenn, Sky’s the Limit,”Hartford Courant, October 21, 1999.然而,道格的成长并非一帆风顺。道格·伦的故事参见Percy Allen,“Former Washington and O’Dea Star Doug Wrenn Finds Tough Times,”Seattle Times, March 29,2009。他从小同单亲母亲相依为命,在西雅图最乱的社区之一“血巷”(Blood Alley)长大。在康涅狄格大学,他一直与周围的人发生冲突。他嘲笑队友,质疑教练,还不顾队规穿着宽宽大大的衣服参加训练。他甚至还做出在鞋店行窃、谩骂警察等违法行为。卡尔霍恩教练实在忍无可忍,最后把他从球队开除。

后来,道格在华盛顿大学又获得了一次机会,可是在那儿,他仍然无法和人们友好相处,葬送了自己的前途。因为上场时间和投篮时机选择等问题,他和教练大打出手,这支球队也将他踢了出去。再后来,道格在NBA选秀大会上落选,在低级别联赛中游走,和母亲住在一起,最后因袭击他人而入狱。“我的职业生涯完了,”2009年道格接受《西雅图时报》(Seattle Times)采访时说道,“我的梦想,我的抱负,全完了。道格·伦死了,那个篮球运动员,那个小伙子,死了。一切都结束了。”道格·伦的故事参见Percy Allen,“Former Washington and O’Dea Star Doug Wrenn Finds Tough Times,”Seattle Times, March 29,2009。凭道格的天分,他本来不仅能成为一名NBA球员,而且有可能成为一名伟大的,甚至是带有传奇色彩的球员,但他从未养成一名球员所需的性情,因此就连大学校队都没能待住。如果曾经拥有更加稳定的童年生活,或许他早就成为下一个迈克尔·乔丹了。

当然,迈克尔·乔丹也有令人印象深刻的垂直跳跃能力,但强大的自我意识和极强的竞争能力使他的性格与道格有所不同。乔丹儿时也是一个很难搞定的孩子Melissa Isaacson,“Portrait of a Legend,” ESPN.com, September 9, 2009, http://www.espn.com/chicago/columns/story?id=445701 7&columnist=isaacson_melissa.有一本乔丹传记写得很棒,参见Roland Lazenby, Michael Jordan: The Life (Boston: Back Bay Books, 2015)。,12岁时曾因打架斗殴被赶出学校,但他至少有一样东西是道格不具备的:一个稳定的中产阶层家庭的成长环境。他的父亲是通用电气的设备主管,母亲是一位银行家。Barry Jacobs,“High-Flying Michael Jordan Has North Carolina Cruising Toward Another NCAA Title,”People, March 19, 1984.在乔丹选择自己事业的道路上,他们都曾给予过乔丹帮助。

事实上,乔丹一路走来一直都有家人的引导和帮助,所以他才可以避过一个极具竞争力的伟大篮球天才很可能躲不过的陷阱。Isaacson,“Portrait of a Legend.”在乔丹被学校开除后,他的母亲就一直带着他去上班。母亲不允许乔丹离开车半步,他只能坐在停车场的车里看书。在乔丹被芝加哥公牛队征募后,他的父母和兄弟姐妹轮番去探望他,确保他没有为名利所诱惑。

《西雅图时报》上有句话很少有人注意到:乔丹的篮球职业生涯没有像道格那样走向终结,他的职业生涯是以他步入篮球名人堂之际的一场演说结束的,当时可谓万众瞩目。Michael Jordan’s Basketball Hall of Fame Enshrinement Speech,YouTube video, posted February 21, 2012, https://www.youtube.com/watch?v=XLzBMGXfK4c. 乔丹演说中最有趣的部分不是他对父母的感激,而是他仍然感觉有必要指出其职业生涯早期的点滴小事。或许只有终生都痴迷于这些点滴小事,才有可能成为有史以来最伟大的篮球运动员吧。在演说中,乔丹说,他一直努力“关注生活中美好的事物——你知道人们是如何看待你的,你又是如何尊重他们的……而公众又是如何看待你的。停一停,想想你做的事情。这一切都是我的父母教会我的”。

数据告诉我们,乔丹感谢他中产阶层的已婚父母是绝对正确的。数据还告诉我们,在比较贫困的家庭中和比较贫困的社区里的确有NBA级别的人才,可他们进不了NBA。这些人有天赋,也有野心,但从来没有培养出成为超级篮球巨星所需的性情。

不论我们凭直觉能够感知到什么,这种视篮球为“生死大事”的绝境似乎依旧无助。类似道格·伦这样的故事可以帮助我们说明这一点,数据也证明了这一点。

2013年6月,勒布朗·詹姆斯在赢得他的第二个NBA总冠军(后来他又赢得了第三个)后,在电视上接受采访。“我是勒布朗·詹姆斯,”他说道,“来自俄亥俄州的阿克伦,我来自城内贫民区,我甚至都不应该出现在这里。”“I’m Le Bron James from Akron, Ohio,” YouTube video, posted June 20, 2013, https://www.youtube.com/watch?v=XceMbPVAggk.随后推特和其他社交网络上对他的批评排山倒海。詹姆斯这样一个天赋异禀的篮球天才,年纪很小时就被视为篮球的未来,他怎么可以公然宣称自己是个失败者呢?事实上,任何一个出身贫寒的人,无论其运动天赋如何,成功的机会都很渺茫。换句话说,詹姆斯的成就其实比起初看起来更加超凡。数据同样也证明了这一点。