第三节 连续型随机变量及其分布
一、连续型随机变量
[定义1] 若对于随机变量X的分布函数F(x),存在非负可积函数f(x),使得对于任意实数x,有
(2-3-1)
则称X为连续型随机变量,称f(x)为X的概率密度函数,简称为概率密度或密度函数,记为X~f(x).概率密度函数的图形称为X的密度曲线.
根据定义可知概率密度具有以下性质:
①f(x)≥0;
②.
反之,若一个函数满足上述性质,则该函数可以作为某个连续型随机变量的概率密度函数.
连续型随机变量分布函数有以下性质.
①对于一个连续型随机变量X,若已知它的概率密度f(x),根据定义可以求得分布函数F(x),同时可以通过密度函数的积分来求X落在任何区间上的概率,即
(2-3-2)
②连续型随机变量X取任一指定值a(a∈R)的概率为0,因为
因此,对连续型随机变量X,有
P{a<X≤b}=P{a≤X<b}=P{a<X<b}=P{a≤X≤b}
由此性质可见,连续型随机变量X取任意值a的概率为0,这说明概率为零的事件不一定是不可能事件.同样,概率为1的事件也不一定是必然事件.
③若f(x)在x处连续,则有
F'(x)=f(x) (2-3-3)
【例2-3-1】 设随机变量X的概率密度为
(1)求系数c;
(2)求X的分布函数;
(3)求P{2<X≤3.5}.
解:(1)根据概率密度的性质有
解得,因此,密度函数为
(2)当x<0时,;
当0≤x<3时,;
当3≤x≤4时,;
当x>4时,
因此
(3).
【例2-3-2】 设随机变量X的分布函数为
(1)求概率P{0.3<X<0.7};
(2)X的概率密度.
解:(1)P{0.3<X<0.7}=F(0.7)-F(0.3)=0.4;
(2)X的概率密度为
二、几种常用的连续分布
1.均匀分布
[定义2] 若连续型随机变量X的概率密度为
称X服从区间[a,b]上的均匀分布,记作X~U[a,b].
由定义可知:(1)f(x)≥0;(2).
均匀分布的分布函数为
对于任意的x1,x2∈[a,b](x1<x2),有
这表明均匀分布的随机变量X落入[a,b]任意子区间的概率与该子区间的长度成正比,而与子区间的位置无关.
【例2-3-3】 某城市每天有两班开往某旅游景点的列车,发车时间分别为早上7点30分和8点,设一游客到达车站的时刻均匀分布于早上7~8点之间,求此游客候车时间不超过20分钟的概率.
解:设游客到达车站的时间为7点过X分,则X~U[0,60],因此X的概率密度为
游客只有在7:10~7:30之间或7:40~8:00之间到达车站,候车时间不超过20分钟,因此所求概率为
2.指数分布
[定义3] 若连续型随机变量X的概率密度为
其中λ>0为常数,则称X服从参数为λ的指数分布,记作X~e(λ).
指数分布的分布函数为
指数分布常用来描述各种“寿命”,如电子元器件的寿命、动物寿命、随机服务系统中的等候时间都服从指数分布.指数分布在可靠性理论和排队轮中有广泛的应用.
【例2-3-4】 设某电子元器件的寿命X(单位:小时)服从参数为的指数分布.
(1)求该元器件在使用800小时后仍没有坏的概率;
(2)求在该元件已经使用了600小时未坏的条件下,它还可以再使用800小时的概率.
解:(1)元器件的寿命X的分布函数为
因此
(2)
上例(2)中的计算结果表明:P{X>1400│X>600}=P{X>800},即在元件使用了600小时未坏的条件下,可以再继续使用800小时的概率,等于它从启用起使用800小时不坏的无条件概率,这种性质称为指数分布的“无记忆性”,相当于说,元器件对已使用过的600小时没有记忆,不影响它以后使用寿命的统计规律.
3.正态分布
[定义4] 若连续型随机变量X的概率密度为
其中μ、σ均为常数,且σ>0,则称X服从参数为μ、σ2的正态分布,记作X~N(μ,σ2).
正态分布的概率密度具有以下性质:
①概率密度的图形关于直线x=μ对称,当x=μ时,f(x)达到最大值:;
②概率密度曲线在x=μ±σ处对应有拐点;
③概率密度曲线以x轴为水平渐近线.
正态分布的密度曲线也称作正态曲线,它是一条钟形曲线:中间高、两边低、左右对称.从图2-3-1、图2-3-2中可以看出,参数μ确定了正态曲线的位置,而σ的大小决定了曲线的陡峭程度.
图2-3-1
图2-3-2
正态分布是概率论与数理统计中最重要的分布,很多随机现象可以用正态分布描述或近似描述,例如:
①测量时产生的误差ε是随机变量,时大时小,时正时负,但是误差大的可能性小,误差小的可能性大,正负误差出现的机会相同,这个特点与正态曲线“中间高、两边低、左右对称”是吻合的,因此测量误差服从正态分布;
②自动包装流水线上生产的罐头重量服从正态分布;
③同年龄人的身高与体重分别都服从正态分布;
④某个地区的年降雨量(单位:毫米)服从正态分布;
⑤超市在一周内售出的鸡蛋的总重量服从正态分布.
正态分布的分布函数为
在正态分布中,当参数μ=0、σ=1时称为标准正态分布,记作X~N(0,1),此时密度函数
分布函数
此时正态曲线见图2-3-3.
图2-3-3 正态曲线
x≥0时,标准正态分布的分布函数值Φ(x)由标准正态分布表(附表2)可查,由此来计算正态分布的概率,根据标准正态曲线的对称性,可知,当x<0时
Φ(x)=1-Φ(-x) (2-3-4)
若X~N(0,1),则
①P{X≤x}=Φ(x)
②P{X>x}=1-Φ(x)
③P{x1<X≤x2}=Φ(x2)-Φ(x1)
④P{|X|≤x}=2Φ(x)-1,(x≥0)
【例2-3-5】 设X~N(0,1),求P{X≤-1.25}及P{-1.5<X<2.3}.
解:由附表2可查得Φ(1.25)=0.8944,于是
P{X≤-1.25}=Φ(-1.25)=1-Φ(1.25)=1-0.8944=0.1056
P{-1.5<X<2.3}=Φ(2.3)-Φ(-1.5)=Φ(2.3)-[1-Φ(1.5)]
=0.9893+0.9332-1=0.9225
任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.
定理 设X~N(μ,σ2),则.
证明 的分布函数
令,上式等于
即
P{Y≤x}=Φ(x)
因此
设X~N(μ,σ2),则X的分布函数
(2-3-5)
若X~N(μ,σ2),则
(1)
(2)
(3)
【例2-3-6】 设X~N(8,0.52),求P{|X-8|≤1}及P{X<10}.
解:
【例2-3-7】 设X~N(μ,σ2),求:
(1)P{μ-σ<X<μ+σ},
(2)P{μ-2σ<X<μ+2σ}
(3)P{μ-3σ<X<μ+3σ}
解:(1)
(2)
(3)
由此看出:X的取值大部分落在区间(μ-σ,μ+σ)内,基本上落在区间(μ-2σ,μ+2σ)内,几乎全部落在区间(μ-3σ,μ+3σ)内,落在以μ为中心、3σ为半径的区间外的概率不到0.003.
从理论上讲,服从正态分布的随机变量X的取值范围是(-∞,+∞),但实际上X取区间(μ-3σ,μ+3σ)外的数值的可能性微乎其微.因此,往往认为它的取值是个有限区间,即区间(μ-3σ,μ+3σ),即实用中的三倍标准差规则,也叫3σ规则.在企业管理中,经常应用这个规则进行质量检查和工艺过程控制.
【例2-3-8】 某厂生产罐装咖啡,每罐标准重量为1千克,长期生产实践表明自动包装机包装的每罐咖啡的重量X服从参数σ=0.1千克的正态分布.为了使重量少于1千克的罐头数不超过10%,应把自动包装线控制的平均值μ调节到什么位置上?
解:X~N(μ,0.12),若把自动包装线控制的在μ值调节到1千克位置,则有:
即重量少于1千克的罐头占全部罐头数的50%,这显然不符合要求.所以应该把自动包装线控制的μ值调节到比1千克大一些的位置,使得
查附表2可得Φ(1.29)=0.90147>0.9,得μ=1+0.1×1.29=1.129.
即将包装控制的平均值μ调节到1.129处,可使得少于1千克的罐头数不超过10%(见图2-3-4、图2-3-5).
图2-3-4
图2-3-5