1.1 古典概率——比率_机会的数学：统计学入门-QQ阅读男生科幻网

上QQ阅读APP看书，第一时间看更新

1.1　古典概率——比率

10 个人，共分 3 张音乐会的票。当然无法每人分 3/10 张，一个大家都能接受的公平办法是凭运气。准备一个盒子，里面放 10 个大小和质地一样的球，其中白球 3 个，黑球 7 个。充分扰乱以后，让每个人抽出一个球，凡抽出白球者得票。

能不能抽到白球是由机遇所定的，在动手抽球之前对此毫无把握。用数学的语言，把“抽出白球”这件事称为一个“随机事件”，即其发生与否是随机会而定的事件，又称为偶然事件。

在这个安排中有两点是大家都能同意的：这是一个公平的解决办法；每个人得到票的机会都是 3/10 = 0.3。让我们对此做一点解说。10 个球的大小和质地都一样，在手感上无区别，抽球前经过充分扰乱，保证了没有哪一个球能先天地占据特殊的位置。因此，对第一个抽球的人来说，10 个球中的每一个都有同等可能的机会被抽出，或者说，在抽球之前存在着 10 个“同等可能”的结果，其中有 3 个是有利的结果。这二者的比值（有利结果数∶总的结果数），就是（或者说规定为）“抽出白球”这个随机事件实现机会的大小，称为其“概率”，在数学上记为如下形式。

(抽出白球) = 3/10

是英文 Probability（概率）的首字母，概率也有“机会的比率”的含义。在较早的著作中也有叫“或然率”的。其实，它不过是白球数所占比率而已。

这个例子自然地推广到一般的情况：假定有个人，分张票，小于。按刚才设计的抽球方式去分，任何一个人得票的概率是。再抽象一步，设想一个试验（抽球可看作一个试验）有个“同等可能”的结果，其中有个结果是使（或说有利于）某事件发生，那么就把事件的概率规定为。这个规定是大家都能同意的，因为，如果要想把此处涉及的机遇加以数量化，则除了用这个数外，再也想不出有其他更合理的做法。不足的是，这个规定不是对一切情况都适用，因为它有两个前提条件：可能结果的总数为有限个；每个结果的出现有同等可能。后一个条件尤其重要，有的试验在理论上讲可以有无限个结果，但经过某种处置，可以近似地转化成有限个结果的情况。但是，“同等可能”这个条件一般都难于满足，这就大大限制了这个规定概率的方法所能应用的范围。

说实话，一项试验的全部结果是否有等可能性，是无法确切证明的。这个概念本身就不具备一种可供证明（或证伪）的清晰的含义，它更多是从感觉上去理解 1。在抽球的试验中，盒中的球事先经过充分长时间的扰乱，时间长到我们感觉到哪一个球都有同等机会处在某个位置，在这个感觉的基础上我们接受“同等可能”的说法。在打麻将、玩扑克时，每局开始前要仔细洗牌，使局中人感觉到，他拿到哪一手牌都有同等的机会。而这个感觉所根据的理由是：牌经过如此仔细洗了以后，能保证每一张牌都有同等机会处在任何一个位置上。在有些问题中，感觉没有提示这种可能性。例如投资一个项目，有两个可能的结果：盈利和蚀本。当决定做这一投资时，当事人一般总是感到盈利的可能性大些，不然他不会做这项投资。因此这里不存在等可能性，也就无法利用上述公式去计算他将会盈利的概率。说等可能性是一种感觉，并非忽视其实际背景，这种实际背景在客观上有理由使我们感觉或认可等可能性的存在，但无法在理论上确证它。

1有趣的是，也有学者从理论上探讨这个问题。例如，美国统计学家戴柯尼斯在 1998 年世界数学家大会上的报告中说，他的研究证明，为把一副有 52 张的扑克牌洗透，用通常的洗牌法，得洗 7 遍才够。

“盒中抽球”这个试验，简单且容易理解，常用来作为实际问题的模型，有重要的认识和应用的意义。比如电视台预报“明天的降水概率为 0.2”，这话的意思不大好理解，或者说，不易使人产生一种形象化的感受。实际上这句话的意思无非是：明天降水的机会，与从一个抽球试验中抽出白球的机会一样，只是在该试验中有 10 个球而白球有 2 个。这个讲法可能容易被更多的人所理解，其不足之处也在过于简单。为说明这一点，让我们回到 10 个人分 3 张音乐会票的那个问题。我们用盒中抽球的模型（盒中 10 个球，3 白 7 黑）来处理这个问题。但抽球的次序有先后，这个次序的先后会不会对抽到白球的概率产生影响？如果会，则这个安排就是非公平的。虽然人们在直觉上都认为这次序无关紧要，但按照这抽球模型的操作，道理可不易说清楚。第一个抽球的人，其抽到白球的机会是 0.3，这一点没有异议。到第二个人抽球时，盒中只剩 9 个球，并且其构成与第一个人抽的结果有关。要讲清他抽得白球的机会仍是 0.3，就得费一把劲，且愈是后抽的人情况愈复杂。

下面我们要介绍一种办法，它能够在更多和更复杂的情况下，体现出“同等可能”这个要求，这就是排列和组合。它们的区别是：排列要讲究次序，而组合则不需要。举例来说明，有 4 个相异的物件，分别用、、、来记。从这 4 个物件中取出 2 个来排列，不同的做法有：

，

共计 12 种。若是取出 2 个来组合，则不同的做法只有

这 6 种。原因在于要计算次序，和要算是不同的排列，但它们是同一个组合，因为它们都由物件和物件组成。举一个形象的例子：某个中学要从 4 位教员中挑选 2 位，分别担任校长和副校长，则挑选的方法有 12 种，因为此处次序很重要。相反，若从 4 位乒乓球运动员中挑选 2 位参加双打，则挑选方法只有 6 种，因为在此次序没有意义。

一般而言，有个相异的物件，从其中取出个进行排列，不同的做法有多少种？用记这个数目，公式为：

，　　　　　　（1）

即把从开始到为止的个整数连乘。当时，就是刚才讨论过的例子。利用公式（1），因，得，与前面给出的结果相符合。注意，在此处及以后，乘号常用一个点简记：4·3 是指。当然，点也用来记小数，这从文义不难分清。

公式（1）的证明不难。它利用下述的一般原则：如果办一件事要依次序经过个环节，而完成第 1 个环节有种不同的方法，完成第 2 个环节有种不同的方法，以此类推，直到完成第个环节有种不同的方法，则办成这件事的不同方法总共有种。这里的理解是：哪怕在一个环节上做法不同，就算不同的方法。例如，由甲地到丙地途中经过乙地。由甲到乙有 5 条路可走，而由乙到丙有 3 条路可走，则由甲至丙不同的走法有 5·3 = 15 种。

我们把上述一般原则用于的计算问题。先把“从个物件中取个去排列”这件事分解成个环节去办。设物件自左至右排列。先从个物件中取 1 个排在最左边，不同的做法有种。次一环节是从剩下的个物件中，取 1 个排在（自左数起）第 2位。因只剩下个物件，完成这一环节的不同做法只有种。下面再依次取排在第 3 位、第 4 位……第位的物件，方法分别有种。因而不同排法的总数，按上述一般原则，应是这个数连乘。

一个重要的情况是。这时依照公式（1），有：

，

即最初个正整数连乘，其结果称为的“阶乘”，记为。例如，5! = 1·2·3·4·5 = 120。是把个相异物件按任意次序排列时，所能排出的不同样式的总数。

得出了排列数的公式，组合数的公式就不难推出了。从个相异物件中取个组合，其不同做法的总数的公式如下。

（2）

道理很简单。每一个由个物件构成的组合，都可以将这个物件任意排列，其数目如刚才论证的为。因此，排列数应为组合数的倍。所以，，即公式（2）。

例如，从 5 个相异物件、、、、中取 3 个组合，按公式（2），不同的做法有

种。这里我们也不难逐一举出组合的结果。

这与用公式（2）算出的结果相符。

用排列（或组合）的安排去体现等可能性的要求，就是把总数为的各种排列（或总数为的各种组合）看成是等可能的。我们用“随意取”这 3 个字来表达这个意思，在实际操作上要体现出这种随意性即等可能性，需做一番布置。例如 5 双大小各不相同的鞋共 10 只，要随意取出 4 只加以排列，可以这样做：在一盒中放 10 个大小和质地一样的球，上面分别书写数字 1, 2,…, 10，同时把 10 只鞋也编号为 1 至 10，把盒中的球充分扰乱后，让一个人依次从中取出 4 个以排成一列，然后把取出的 4 个球换成与其数字相同的鞋。在球“充分扰乱”的前提下，我们认可：所有可能的种排列有等可能性，即其中每一个排列有相同的机会 (1/5040) 出现。

下面举几个实例说明排列组合方法在概率计算中的应用。先看那个 10 人分 3 张音乐会票的问题。我们曾讲到，用“抽球模型”的困难，在于不明确其机会是否与抽的次序有关，即怎样去证明，不论你排在第几位去抽，你得票的机会总是 3/10。采用排列的方法，这一点容易看清楚：10 个人依次随机抽出一球，在效果上等同于把这 10 个球随意排成一列，每种排法有等可能性。因此，把这 10 个球自 1 至 10 编上号，不妨把 3 个白球编成 1 号、2 号和 3号（把球编号的目的是使 10 个球成为相异的，以适应前面“ 个相异物件”的提法）。再把 10 个人也自 1 至 10 编上号。把 10 个球自左至右随意排成一列，让 1 号人取最左边的球，2 号人取次左的球，以此类推，在这一安排下，10 个人的地位完全是对等的（在抽球安排中，每人轮到时盒中剩下的球数不同，故表面上看各人似乎不对等），因而有一样的机会拿到白球，即 3/10。这一点不难通过计算证明。以编号是 4 的人为例（他要拿自左数起第 4 个球）。10 个球任意排列，排法的总数，为。这是这个“试验”的可能结果总数。为使“编号为 4 的人拿到白球”这一事件实现，其有利排列方法数目可计算如下。首先，自左数起第 4 位应放一个白球，即 1、2、3 号球中之一，其不同的做法有 3 种。这步做了以后，剩余的 9 个球可在剩余的 9 个位置任意排列（而不影响编号为 4 的人取得白球），其做法共有种。这样，有利于“4 号人拿白球”这事件实现的排列总数为 3·9!，而其概率为 3·9!/10! = 3/10。

再看一个例子。有 4 双大小不一的鞋共 8 只，现随意把它们分成 4 堆，每堆 2 只，问“每堆都恰成一双”这一事件的概率有多大。“随意分成 4 堆，每堆 2 只”的意思是，把 8 只鞋分成 4 堆，每堆 2 只的方法（即不同的分法）有许多，而做法要保证每一种可能的分法都有同等机会出现。你可以想出很多模型（其每一种都使人们认可其同等机会性）来实现这一点。最简单的是下面的安排：把 8 只鞋随意排成一列，取最左的 2 只为一堆，次左的 2 只为一堆，以此类推。排列的等可能性保证了分堆的等可能性。把 8 只鞋随意排成一列的方法，有种。有利于事件（每堆成双）实现的排列总数可计算如下。左 1 位可自 8 只中任选一只，方法有 8 种。取定后，左 2 位必须与之配对，故只有 1 种取法。这两位定下后，左 3 位可在余下的 6 只中任取 1 只，方法有 6 种。取定后，左 4 位只有 1 种取法，以此类推，左 5、6、7、8 位依次有 4、1、2、1 种取法。故有利于事件实现的排列数为

按公式，可如下计算。

最后看一个组合的例子。仍是 4 双大小不一的鞋共 8 只，把它们随意分成两堆，每堆 4 只。问：“每堆恰好是 2 双”这个事件的概率。

“分 2 堆，各 4 只”可以这样来实现。从 8 只鞋中随意取出 4 只成一堆（不计次序，是组合），剩下 4 只自成一堆。为了实现事件，只要取出的那一堆恰成 2 双就行。从 8 只鞋中取 4 只（组合）的做法，总数为。有利于事件实现的取法可如下计算。先把各双鞋分别用绳子捆在一起各成一堆，共 4 堆，然后在这 4 堆中取出 2 堆，取法有种。故事件的概率。

这个题也可以用排列去做，但计算上要麻烦得多，主要是在计算有利于事件的排列上。以上这两个题若用抽球模型去做就不好办。

基于试验结果的等可能性，用公式规定的概率，叫作“古典概率”。这是唯一的一种情况，使事件概率能通过简单明了的方式去定义，并给出了简单可行的算法。“古典”一词，表明这一定义的起源古老。概率论是研究概率计算及与之相关的问题的学科，在概率论的萌芽期，研究的对象全限于古典概率。古典概率最先由何人在何时提出，文献中无明确记载，可以肯定的是它起源于（用骰子为工具的）赌博。古典概率的概念在赌博活动中形成，乃是一种集体智慧。其中，16 世纪的意大利数学家和“赌博家”卡尔达诺（1501—1576）起了重要作用。

骰子是一个均匀的正六面体，各面分别标示点数 1 至 6。由于质地均匀及其正方体形状，骰子在投掷时，或放在封闭容器内充分摇晃后，可以认为出现哪一个点（该面朝上）有同等可能性，即 1/6，这成为赌博公平性的基础。从 14 世纪以来，使用骰子作赌具在欧洲已蔚成风气，到后来才被扑克等所取代。骰子赌博的活动孕育出有关概率的一些最初的概念，其原因在于：（1）在赌博中机遇的作用特别明显，参加者出乎对自己胜负的关心，自然要注意到各种可能情况出现机遇大小的计算问题；（2）赌博是一种在同样条件下可以多次重复的活动，这有利于积累经验并与理论上的计算做比较；（3）骰子赌博中出现的情况不太复杂，有关的概率计算，在人们当时掌握的数学知识水平上能对付得了（扑克就复杂得多，所以以它为工具的赌博未能在早期概率论的发展中起多少作用）。它又不是过于简单，使一些概念能从中取得发展空间。骰子赌博在概率论发展中所起的作用，还可以从下述事实看出。直到 18 世纪前期，一些概率论大学者，如惠更斯、伯努利等人的有重要影响的概率论名著中，相当大一部分内容是讨论骰子赌博中的机遇计算问题。

回过头来说说卡尔达诺。他是意大利米兰一位律师的私生子，青年时选择的专业是医学。得力于其父是一位兼职数学教师，他还兼习数学。由于他沉溺于赌博以及其出身背景，求职不顺利的他，最后只好当了一名数学教师。但与一般赌徒不同的是，他参加赌博活动有一种理性的成分和出于研究的爱好。1564 年，他写了一本名为《机遇博弈》的著作（机遇博弈是指其胜负纯凭机遇的博弈，如掷骰子，与下围棋这类涉及技巧的博弈不同），但这部著作到他死后 87 年的 1663 年，才得以发表。他在书中认为，赌博是一种社会病，像生理上的疾病一样，有理由作为研究的对象。

这是概率史中最早的一本成书的著作，在历史上有重要地位，迟至 1961 年还出版了其英译本。他在书中提出了“诚实的骰子”的概念，指的是在投掷骰子时，其 6 面都有同等的机会出现。这是第一次在一个特例中明确提出“同等可能”这个概念，但他没有将其推广到一般的情况。不过，作为教学的目的，他提出了所谓“3面骰子”及 4 面、5 面骰子的概念，这可以解释为他把等可能概念由 6 推广到 3、4、5。更重要的是，他引入了参赌者的“胜率”这个概念：设赌局有个等可能的结果，其中个结果使某赌徒得胜，余下个结果使他输掉，则定义他的胜率为或。按前述，我们定义该赌徒得胜的概率为。可以看出，概率与胜率的关系是：概率 = 胜率 /（1 + 胜率）。因此，他的这个提法，从实质上说，已达到了古典概率的定义的程度，可惜他没有明确提出来。不过，“胜率”这个概念一直沿用至今。

因为赌博时一般使用多个骰子，所以卡尔达诺把一个骰子 6 面的等可能性，推广到了多个骰子的情形。用他的话说就是，“几个诚实的骰子联合起来仍是诚实的”。以两个骰子为例，将其编号为 1 和 2，则投掷时有 6·6 = 36 种可能结果。

11, 12,…16, 21, 22,…26,…, 61, 62,…, 66

其中，例如“42”这个结果表示第一个骰子掷出 4 而第二个骰子掷出 2。卡尔达诺的意思是，如果两个骰子都是“诚实的”，那么以上所列的 36 个结果就具有等可能性。这个论断可类推到任意个骰子的情形。有了这个，就可以计算在多个骰子的赌局中，某种情况出现的机会有多大。让我们举一个现实生活中的例子。

若干年前，街上曾有过一种赌博的地摊。摊主让顾客投掷 3 个骰子，胜负的规则是：若顾客掷出 3 个骰子点数之和为

3, 4, 5, 6, 7, 14, 15, 16, 17, 18

这些数中之一时，顾客胜；若掷出点数和为其他数，即 8, 9, 10, 11, 12, 13 时，摊主胜。一时之间，上钩者不在少数。究其心理，大概是基于以下的考虑：掷 3 个骰子得到的点数和有 3, 4, 5,…, 16, 17, 18 等 16 种可能情况，而按规则顾客胜的有 10 种，这显得较为有利。实践结果多是摊主胜。其原委不难看出，关键在于这 16 个可能结果并无等可能性。把投掷 3 个骰子的总共 6·6·6 = 216 种结果，按字典序列如下排列。

111, 112,…, 116,…, 661, 662,…, 666

按卡尔达诺的上述原则，这些结果有等可能性。但是，如果逐一检查这 216 个结果，那么就会发现，例如，其和为 3 的结果只有 1 个，而和为 10 的结果则有 27 个。因此，掷出和为 10 的机会，是掷出和为 3 的机会的 27 倍，二者远非等可能的。逐一检查还会发现，使顾客获胜的结果数只有 69，而摊主获胜的结果数有 147，情况远远有利于摊主。类似的骗局以不同的形式出现过，行骗的对象，就是那些对机遇大小缺乏数量概念，而易于被某些表面现象迷惑的人。

本周热推：

爱与数学数学与人类文明一个数学家的辩白（双语版）世界是随机的：大数据时代的概率统计学无言的宇宙