第二节 离散型随机变量
一、离散型随机变量的概率分布
[定义1] 设离散型随机变量X所有可能的取值为x1,x2,…,xk,…,称
P{X=xk}=pk (k=1,2,3,…)
为X的概率分布或分布律.
常用表格的形式来表示分布律:
根据概率分布的定义,pk(k=1,2,3,…,)必然满足:
①pk≥0,(k=1,2,3,…)
②
由分布函数的定义F(x)=P{X≤x},离散型随机变量X的分布函数为
(2-2-1)
【例2-2-1】 消费者协会收到大量顾客来信,投诉他们购买的空调器的质量问题,消费者协会对数据进行整理后给出空调器重要缺陷数X的概率分布:
其中这些概率都是用统计方法确定的,其和为1.从概率可以看出,多数空调器的缺陷数在1和5之间,而超过6个缺陷的空调器是较少的,用此概率分布可以计算出下列事件的概率:
P{1≤X≤5}=P{X=1}+P{X=2}+P{X=3}+P{X=4}+P{X=5}=0.895
P{X>6}=P{X=7}+P{X=8}+P{X=9}+P{X=10}=0.044
【例2-2-2】 设盒子中有5个球,其中2个白球、3个黑球,先从中任意取出3个球,求取到白球数X的概率分布.
解:X的可能取值为0,1,2,则
即
【例2-2-3】 设X的概率分布为
求X的分布函数.
解:分布函数F(x)=P{X≤x}
当x<-1时,F(x)=P{X≤x}=0
当-1≤x<1时,F(x)=P{X≤x}=P{X=-1}=0.2
当1≤x<2时,F(x)=P{X≤x}=P{X=-1}+P{X=1}=0.7
当x≥2时,F(x)=P{X≤x}=P{X=-1}+P{X=1}+P{X=2}=1
因此
【例2-2-4】 下列数列能否作为一个随机变量的概率分布?
(1)(k=1,2,3,4)
(2)(k=0,1,2,3,4)
(3)pk=2-k(k=1,2,…,n)
解:数列(1)不能作为一个随机变量的概率分布,因为p3<0和p4<0.
数列(2)也不能作为一个随机变量的概率分布,因为.
数列(3)能作为一个随机变量的概率分布,因为pk>0(k=1,2,…,n);且它们的和为1.
二、几种常用的离散型分布
1.伯努利分布(0—1分布)
[定义2] 若随机变量X的概率分布为
P{X=1}=p,P{X=0}=1-p (0<p<1)
则称随机变量X服从伯努利分布或0—1分布.
伯努利分布的试验背景是伯努利试验,若在一次伯努利试验中,某个事件A发生的概率为p,则事件A发生的次数X服从伯努利分布,即
2.二项分布
[定义3] 若随机变量X的概率分布为
则称X服从参数为n,p的二项分布,记作X~B(n,p).
二项分布的试验背景是n重伯努利试验.在n重伯努利试验中,若一次实验中事件A发生的概率为p,则n次试验中事件A发生k次的概率为.由二项式定理可知
【例2-2-5】 某单位有4辆汽车,假设每辆车在一年内至多只发生一次损失,且各自相互独立,具有相同的损失率p=0.1,试建立该单位一年内汽车损失次数的概率分布.
解:设X表示该单位一年内汽车损失次数,n=4,p=0.1,则X~B(4,0.1),按照二项分布的定义有
即
【例2-2-6】 一批产品的废品率p=0.03,每次抽取一个产品,进行20次有放回抽样,求出现废品的频率为0.1的概率.
解:设X表示20次有放回抽样中废品出现的次数,则X~B(20,0.03).
所求概率为
【例2-2-7】 甲、乙两棋手约定进行10盘比赛,以赢的盘数较多者胜,设在每盘中甲赢的概率为0.6,乙赢的概率为0.4,在各盘比赛相互独立的条件下,甲胜、乙胜和不分胜负的概率各是多少?
解:若用X表示10盘棋中甲赢的盘数,则X~B(10,0.6),按照约定,甲赢6盘或6盘以上即得胜,因此有
类似地分析有
因此甲胜的概率为0.6331,乙胜的概率为0.1662,甲乙不分胜负的概率为0.2007.
3.泊松(Poisson)分布
在历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松(Poisson)首次提出的,以后发现,很多取非负整数的离散随机变量都服从泊松分布.
[定义4] 若随机变量X的概率分布为
则称随机变量X服从参数为λ的泊松分布,记作X~P(λ).
容易算得
泊松分布的概率值可由附表1查得.
泊松分布是常用的离散分布之一,它常与计数过程相联系,现实世界中很多随机变量都为泊松分布.例如:
①一段时间内,来到公共汽车站的候车人数;
②一段时间内,某个操作系统发生故障的次数;
③一段时间内,超市排队等候付款的顾客人数;
④一个稳定的团体内,活到100岁的人数;
⑤一匹布上,疵点的个数;
⑥100页书上,错别字的个数.
【例2-2-8】 某城市每天发生火灾的次数X服从参数λ=0.8的泊松分布,求该城市一天内发生3次或3以上火灾的概率.
解:参数λ=0.8的泊松分布的概率分布为
所求概率为
在二项分布B(n,p)中,若相对的n很大、p较小时,二项分布的概率很难计算,以下给出这种情况下二项分布概率的近似计算方法.
定理 (泊松定理)设随机变量Xn~B(n,pn),且参数n、pn满足,则对任意非负整数k,有
证略.
由以上定理可知,X~B(n,p)时,若相对的n很大、p较小时(一般n≥100,p≤0.1)时,可以用泊松分布近似计算二项分布的概率.即近似的有
X~P(λ), (λ=np)
即
【例2-2-9】 在500人组成的团体中,恰有k个人的生日是在元旦的概率是多少?
解:在该团体中,每个人生日恰好在元旦的概率为,则该团体中生日在元旦的人数.因此
这个概率很难计算,由泊松定理,令,则有
为了比较,对计算后与(k=0,1,2,…,6)进行对比(见表2-2-1).
表2-2-1 二项分布与泊松分布近似的比较
【例2-2-10】 保险公司售出某种一年期寿险保单2000份,已知此种寿险每单需交保费100元,当被保人一年内死亡时,保险公司赔付2万元.假设已知此类被保险人一年内死亡的概率均为0.002,试求:
(1)保险公司从此种寿险获利不少于10万元的概率(营业成本忽略不计,下同);
(2)保险公司从此种寿险获利不少于18万元的概率.
解:由题可知,保险公司2000份保单的收入为20万元.设X表示一年内被保险人的死亡人数,则X~B(2000,0.002),保险公司一年的赔付为2X万元.
显然近似的有X~P(4),则
(1)
(2)
4.超几何分布
[定义5] 若随机变量X的概率分布为
其中N、M、n均为自然数,且M<N、n<N,则称随机变量X服从参数为N、M、n的超几何分布.
超几何分布的试验背景是不放回抽样.
【例2-2-11】 20个产品中有5个不合格品,若从中随机取出8个,求其中不合格品数的概率分布.
解:由题可知,N=20,M=5,n=8,则
将计算结果列表为
【例2-2-12】 设有一大批发芽率为90%的种子,现从中任取10粒,求播种后
(1)恰有8粒发芽的概率;
(2)至少有9粒发芽的概率.
解:从一大批种子任取10粒,发芽的种子数X服从超几何分布,但参数N、M均未知.由于10粒种子从一大批中取出,即N很大而n相对N很小,此时不放回抽样可近似看成有放回抽样,即超几何分布近似为二项分布,即近似的有X~B(10,0.9),因此
(1)
(2)
5.几何分布
[定义6] 在伯努利试验中,若一次试验成功的概率为p,随机变量X表示独立重复该试验直到成功为止需要的次数,则X的概率分布为
P{X=k}=(1-p)k-1p (k=1,2,…)
称随机变量X服从参数为p的几何分布.
【例2-2-13】 若一批产品不合格率为0.01,现有放回抽样,每次一件直到抽到不合格品为止,求抽查次数X的概率分布.
解:抽查次数X服从参数为p=0.01的几何分布,其概率分布为
P{X=k}=(0.99)k-1×0.01 (k=1,2,…)