学会接纳错误
通过这种决策方法,以及使用树型思维或无监督方法在我们的心智模型中加入混乱与复杂性,我们得以更实际地预测事件并根据现有证据做出决策。
这种方法之所以有用,不仅因为它很灵活,能根据情况进行调整,还因为它更加清晰地反映了我们生活中的复杂现实。它使我们在事情出错时,或我们认为事情可能会出错时做出更有效的反应。
坦率地说,这就是科学比人类能够更好地应对问题的原因。如果你是一个生物化学家或统计学家,误差不会让你感到困扰,因为你不会让它困扰你。误差可能会让人恼怒、浪费时间,但也是必要的、吸引人的。科学在误差的基础上蓬勃发展,因为误差让我们不断调整、发展并修正我们基本假设中的错误。只有借助异常值与离群值,我们才能对所研究的信息单元、数据集或数学问题拥有全面的认识。
这就解释了为什么统计学将标准误差(standard error)作为基本原则,其内在假设是:总有一些事物不符合预期和预测。在机器学习领域,数据集里存在着一些噪声数据、噪声信息,这些数据和信息实际上并没有告诉我们任何有用的东西,也没有帮助我们创建有意义的聚类簇。只有了解系统中的自然噪声,我们才能有效发挥大数据组的作用。如果你不能研究并理解噪声、误差以及均值的偏差,你就无法取得最佳的结果。归根结底,一个环境中的噪声往往是另一个环境中的信号——就像一个人的垃圾是另一个人的财富一样,因为信号不是客观的,而是取决于一个人所寻求的目标。如果科学家不承认误差存在的必要性,不迷恋那些与他们的假设矛盾并驳倒这些假设的现象,就永远不会做出突破性的研究。
然而,当事情不如意的时候,人们可能不那么乐观。当列车晚点或取消时,不会有很多乘客兴高采烈地谈论标准误差。这是因为我们受到的教导是要从情感而非科学的角度来考虑错误。我们通常会很快地把错误当作失败的表现,并且得出结论:列车的班次系统不能正常运作,或者导致这个结果的决策是完全错误的。真相往往没有那么极端:大多数时候,列车是准点的;在大多数可以预见的情况下,你的决定可能会带来不同的效果。
经历挫折不能说明所有事情都已失败,也不代表我们应该全盘抛弃一个系统或决策。在历史上,如果科学家和技术人员一直用这种方法对待错误,那人类绝不可能取得今天的成就。即使是在日常生活中,只要事情出了差错,人们就会变得充满活力——哪怕只是因为列车晚点而生气,或者陌生人占用了你一贯的候车地点。
对误差的下意识反应是盒型思维的主要缺陷之一。就像采用监督算法一样,我们为每个数据点与情境分配了一个二元的属性——是或否,对或错,老鼠或仓鼠。这种做法限制了我们以恰当的视角看待问题的能力,使每个误差看起来都像是致命的错误。列车被取消了,所以我这一天的计划都泡汤了。这种思维制造了一种危险的错觉,让我们认为总是存在绝对正确或错误的决策,而最困难的事情就是在这两者之间做出一个至关重要的抉择(典型的盒型思维)。对我来说,这种错觉会让一次挫折(没赶上列车)毁掉我的一天,因为我的计划出了差错,所以我就会陷入崩溃。
由于现实远比这种设想更为复杂,所以我们思考问题和做出决策的技巧也必须如此。如果你用盒型思维思考,一旦事情出错,你就难以继续前进了。你唯一的选择就是给这件事贴上失败的标签,然后重新开始。如果你用树型思维来思考,你身边就会有许多备选的分支,这些分支就是你在头脑中预先设想的前进路线。此时,改变方向要容易得多,也有效得多,因为你没有把所有的筹码全押在一个结果上。你已经为这种可能性做好了计划,也为自己保留了很多有价值的备选方案。
与直觉相反,机器学习可以帮助我们在评估面前的决策时,少一些机械化的感觉,多一些人情味。它告诉我们,错误是正常的,是真实数据中必然存在的。很少有真正的二元选择(如果那种东西真的存在),并不是每件事物都能被归入已有类别,或者可以推导出简洁而无可辩驳的结论。例外造就了规则。我从机器学习的角度受益,并不是因为它过滤掉了人生中固有的随机性与不确定性,而是因为它比大多数人都能更容易接受随机性与不确定性,并提供了一种从中受益的方法。机器学习能让我为自己害怕的情况做好计划,并且在事情出错的时候做好准备。
树型思维很重要,因为它反映了我们环境的复杂性,并且能帮我们变得更加富有韧性。就像一棵挺立了数百年的参天橡树,决策树可以经得起任何考验。即使是在我们跳上思维的盒子,砸坏并永远地遗弃盒子之后,这棵巨树依然屹立不倒。
[1] 此处将列车按时到达视为正常事件,将列车晚点或取消视为标准误差事件。——译者注