§3 二维随机变量及其分布
在实际问题中,有很多随机现象往往需要引进两个或更多个随机变量来描述。为此,有必要研究多维随机变量及其分布。本节主要介绍二维随机变量及其分布。
一、二维随机变量及其联合分布
要考查一个圆柱形工件尺寸是否合格,需要考查径向尺寸X与轴向尺寸Y,X与Y都是随机变量,要考查圆柱形工件尺寸的合格率就需要研究二维随机变量及其概率分布。
定义3.1 设Ω为随机试验E的样本空间,X,Y是定义在Ω上的一对有序的随机变量,则称(X,Y)为二维随机变量。
对于任意一对实数x,y,称二元函数
F(x,y)=P{X≤x,Y≤y}(3.1)
为(X,Y)的联合分布函数(joint distribution function),简称为(X,Y)的分布函数。
(X,Y)的分布函数F(x,y)实际上是(X,Y)取值落在区域G={(x,y)|-∞<X≤x,-∞<Y≤y}内的概率。如图2-5(左)所示。
图2-5
由图2-5(右)可知
P{a<X≤b,c<Y≤d}=F(b,d)-F(b,c)-F(a,d)+F(a,c) (3.2)
二维随机变量的分布函数有下列性质:
(1)0≤F(x,y)≤1;
(2)F(x,y)对于x,y都是单调不减的;
(3)F(-∞,y)=F(x,-∞)=F(-∞,-∞)=0,
F(+∞,+∞)=1; (3.3)
(4)F(x,y)对于x,y均右连续;
(5)对于任意的x1,x2,y1,y2,且x1≤x2,y1≤y2,均有
P{x1<X≤x2,y1<Y≤y2}=F(x2,y2)-F(x2,y1)-F(x1,y2)+F(x1,y1)≥0成立。
前4条性质与一维随机变量分布函数性质相似,性质(5)由概率的非负性和F(x,y)的单调性可知是正确的。
1.二维离散型随机变量及其联合分布
定义3.2 如果二维随机变量(X,Y)中的X与Y分别都是离散型随机变量,即(X,Y)可能的取值为有限对或可列无限对,则称(X,Y)为二维离散型随机变量。称随机事件{X=xi,Y=yj}(即事件{X=xi}∩{Y=yj})的概率P{X=xi,Y=yj}=pij(i,j=1,2,…)为(X,Y)的联合分布律或联合分布(joint distribution)。
联合分布率常用下面表格形式表达
(X,Y)的联合分布律有下列性质:
(1)0≤pij≤1(i=1,2,…,m,…;j=1,2,…,n,…);
(2);
(X,Y)的联合分布函数为
(3.4)
其中和号是对满足条件“xi≤x且yj≤y”的所有pij求和。
【例1】 一个口袋里装有三个球,分别标有号码1,1,2,从中先后任取两个球,第一次取出球的标号为X,第二次取出球的标号为Y,求(X,Y)的联合分布律。
解 (1)(不放回抽样)由概率的乘法公式可得(X,Y)的联合分布律:
或用表格形式
表示。
(2)(放回抽样)由概率的乘法公式可得(X,Y)的联合分布律为
2.二维连续型随机变量及其联合分布
定义3.3 若二维随机变量(X,Y)的分布函数F(x,y)对任意x,y有
(3.5)
其中f(x,y)≥0。则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的联合密度函数,简称联合密度。
(X,Y)的联合密度具有下列性质:
(1)f(x,y)≥0;
(2);
(3)在f(x,y)的连续点处,有
(4)若G是xOy平面上的任一区域,则
(3.6)
凡满足前两条性质的函数f(x,y)均可作为二维连续型随机变量的联合密度。
【例2】 设(X,Y)的联合密度函数为
求(1)(X,Y)的分布函数;(2)求P{0<X<1,X<Y<1}。
解 (1)
当x≤0或y≤0时,f(s,t)=0
故 F(x,y)=0
当x>0,0<y≤x时
(积分限的确定如图2-6所示)
图2-6
当x>0,y>x时,
(积分限的确定如图2-7所示)
图2-7
(2)
几种常用的二维连续型随机变量的分布:
(1)均匀分布 若(X,Y)的联合密度为
(3.7)
式中,G为xOy平面上的有界区域;s为区域G的面积。则称(X,Y)服从区域G上的均匀分布。
(2)二维正态分布 若(X,Y)的联合密度为
(3.8)
其中 μ1,μ2,σ1,σ2,ρ均为实常数,且σ1>0,σ2>0,-1<ρ<1(-∞<x<+∞,-∞<y<+∞)。
则称(X,Y)服从二维正态分布。记为
对于二维随机变量的讨论可以推广到n(n>2)维随机变量的情形。
设X1,X2,…,Xn是建立在随机试验E的样本空间Ω上的一组n个有序随机变量,则称(X1,X2,…,Xn)为n维随机变量(或n维随机向量)。对于任意的(x1,x2,…,xn)∈Rn,称F(x1,x2,…,xn)=P{X1≤x1,X2≤x2,…,Xn≤xn}为(X1,X2,…,Xn)的联合分布函数(或简称分布函数)。它具有类似于二维随机变量分布函数的性质。
二、边缘分布与*条件分布
1.边缘分布
二维随机变量(X,Y)中的X和Y都是随机变量,它们各有自己的分布函数FX(x),FY(y),而(X,Y)又有联合分布函数F(x,y),它们之间既有区别,又有联系。为了深入研究,于是引入边缘分布的概念。
定义3.4 设F(x,y)为二维随机变量(X,Y)的联合分布函数,则称
为(X,Y)关于X的边缘分布函数(marginal distribution function)。同理,称
(3.9)
为(X,Y)关于Y的边缘分布函数。
对于离散型的情形,(X,Y)的两个边缘分布函数分别为
(X,Y)的两个边缘分布律分别为
(3.10)
对于连续型的情形,(X,Y)关于X,Y的两个边缘分布函数分别为
(X,Y)的两个边缘密度函数分别为
(3.11)
【例3】 设(X,Y)的联合分布律为
求(X,Y)的边缘分布律。
解 (X,Y)关于X,Y的边缘分布律分别为:
边缘分布律与联合分布律可用同一表格表示,如例3可表示为
一般情形如下表所示
【例4】 设(X,Y)的联合密度为
求(1)常数C;(2)fX(x),fY(y)。
解 (1)由f(x,y)的性质(2)可知
即,故C=6。
(2)
当x<0时,f(x,y)=0,因而fX(x)=0;
当x≥0时,0;
故
同理可得
【例5】 设(X,Y)在区域G内服从均匀分布,其中G由y=x,所围成(如图2-8所示),求边缘概率密度fX(x),fY(y)。
图2-8
解 G的面积
所以
同理
【例6】 设,求fX(x),fY(y)。
解 由式(3.11)知
由式(3.8)知
令
则
同理可得
由上述结果可知:(X,Y)关于X的边缘分布为,关于Y的边缘分布为,它们都与ρ无关。由联合分布可唯一确定边缘分布。反过来,一般由边缘分布不能确定联合分布。
*2.条件分布
由条件概率很自然地引出条件分布。
设二维离散型随机变量(X,Y)的联合分布律为
pij=P{X=xi,Y=yj} (i,j=1,2,…)
(X,Y)关于X和Y的边缘分布律分别为
设pi·>0,p·j>0,我们考虑在事件“Y=yj”发生条件下事件“X=xi”发生的概率。也就是要研究P{X=xi|Y=yj}。
令 A={X=xi},B={Y=yj}
因 P(A)=pi·>0,P(B)=p·j>0
由条件概率定义
即 (3.12)
同理可得
(3.13)
不难验证
(1)P{X=xi|Y=yj}≥0;
(2)。
于是我们引出下列定义:
定义3.5 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=yj}>0,则称
为在Y=yj条件下随机变量X的条件分布律。
同样,对于固定的i,若P{X=xi}>0,则称
为在X=xi条件下随机变量Y的条件分布律。
值得指出的是式(3.12)和式(3.13)可分别改作
P{X=xi,Y=yj}=P{Y=yj}·P{X=xi|Y=yj}
P{X=xi,Y=yj}=P{X=xi}·P{Y=yj|X=xi}
这两个式子与事件概率的乘法公式是十分相似的。
【例7】 一射手进行射击,击中目标的概率为p(0<p<1),射击到击中目标两次为止。设X表示第一次击中目标时的射击次数,Y表示射击的总次数,试求(X,Y)的联合分布律及条件分布律。
解 设第一次击中目标为第m次,总的射击次数为n次,则
当m=1,2,…时
当n=2,3,…时
【例8】 设袋中有白球3个,黑球3个,红球2个。现从中任取2球,其中白球与红球的个数分别记作X与Y,求(1)P{X+Y=1};(2)Y=1条件下,随机变量X的条件分布。
解 由古典概型可得(X,Y)的联合分布律
这是二维超几何分布,其分布律的表格形式如下
(1)
(2)
设(X,Y)是二维连续型随机变量。这时,由于对任意的x,y都有P{X=x}=0,P{Y=y}=0,因此就不能用条件概率公式引入条件分布了。下面,用极限的方法来处理。
给定y,设对于任意给定的正数ε,P{y-ε<Y≤y+ε}>0,于是对于任意实数x有
上式给出了在条件y-ε<Y≤y+ε下X的条件分布函数。现在我们引入以下定义。
定义3.6 给定y,设对于任意给定的正数ε,P{y-ε<Y≤y+ε}>0。若极限
存在,则称此极限为在条件Y=y下X的条件分布函数。记为
FX|Y(x|y) 或 P{X≤x|Y=y}
设(X,Y)的联合分布函数为F(x,y),联合密度为f(x,y),而f(x,y)在点(x,y)处连续,边缘密度函数fY(y)连续,且fY(y)>0,则有
即 (3.14)
若记fX|Y(x|y)为在条件Y=y下X的条件概率密度,则由上式知
(3.15)
同理可推出,若f(x,y)在(x,y)处连续,fX(x)连续且fX(x)>0,则
(3.16)
(3.17)
【例9】 设(X,Y)在区域G:{(x,y)/0≤x<1,且内服从均匀分布,求fY|X(y|x);fX|Y(x|y)。
解 由例5可知
由式(3.15)、式(3.17)可得,
当0<x<1时
当0<y<1时
【例10】 设,求fX|Y(x|y);fY|X(y|x)。
解 由例6知
又由式(3.15)、式(3.17)可得
由此可知,二维正态分布的条件分布仍为正态分布。
三、随机变量的独立性
由随机事件的独立性不难引出随机变量的独立性。设F(x,y),FX(x),FY(y)分别为(X,Y)的联合分布函数和边缘分布函数,{X≤x}为随机事件A,{Y≤y}为随机事件B。若随机事件A,B独立,则
P(AB)=P(A)P(B)
即 P{X≤x,Y≤y}=P{X≤x}·P{Y≤y}
也就是 F(x,y)=FX(x)FY(y)
从而,我们可以引入两个随机变量独立的定义。
定义3.7 设F(x,y),FX(x),FY(y)分别是(X,Y)的联合分布函数和边缘分布函数,若对任意实数x和y都有
F(x,y)=FX(x)FY(y) (3.18)
则称随机变量X与Y相互独立,简称独立。
前边已经讲过,由(X,Y)的两个边缘分布一般不能确定(X,Y)的联合分布。但是,当X,Y相互独立时,(X,Y)的联合分布可由其边缘分布唯一确定
F(x,y)=FX(x)FY(y)
随机变量的独立性有如下等价形式:
(1)若(X,Y)是离散型随机变量,X与Y相互独立的充分必要条件是,对(X,Y)所有可能取值(xi,yj)都有
P{X=xi,Y=yj}=P{X=xi}·P{Y=yj}
(2)若(X,Y)是连续型随机变量,则X与Y相互独立的充分必要条件是,在f(x,y)的连续点(x,y)处都有
f(x,y)=fX(x)fY(y)
下边的定理以后常常用到。
定理3.1 若随机变量X与Y相互独立,g1(x)与g2(x)是任意两个连续函数,则g1(X)与g2(Y)也相互独立。
【例11】 设随机变量X,Y相互独立且具有二维分布律:
试求a,b的值。
解
P1·=P{X=1}=1/8+a, P2·=P{X=2}=3/8+b
P·1=P{Y=3}=1/8+3/8=1/2, P·2=P{Y=4}=a+b
又因X,Y相互独立,所以p11=p1·p·1,即
又,所以
【例12】 已知(X,Y)服从区域上的均匀分布,求关于X和Y的边缘分布密度,并判定X和Y是否独立?
解 由式(3.7)知,(X,Y)的联合密度为
因 f(x,y)≠fX(x)fY(y)如在处,故X,Y不独立。
【例13】 若(X,Y)服从二维正态分布。试证:X,Y相互独立的充分必要条件是ρ=0。
证明 由例6知
若X与Y独立,则f(x,y)=fX(x)fY(y)对任意x与y均成立,在(μ1,μ2)点当然也成立。即
所以,故ρ=0。
若ρ=0,显然有f(x,y)=fX(x)fY(y)恒成立。故X与Y独立。
随机变量的独立性可以推广到n(n>2)个随机变量的情形。即若n个随机变量X1,X2,…,Xn均定义在同一样本空间Ω上,对任一组实数(x1,x2,…,xn)∈Rn,均有
P{X1≤x1,X2≤x2,…,Xn≤xn}=P{X1≤x1}P{X2≤x2}…P{Xn≤xn}
即
则称X1,X2,…,Xn相互独立,简称独立。
n个随机变量X1,X2,…,Xn独立的含义是随机向量(X1,X2,…,Xn)的联合分布函数是各个Xi的边缘分布函数的乘积。
特别地,当(X1,X2,…,Xn)是连续型随机向量时,则n个随机变量X1,X2,…,Xn独立的充要条件是:随机向量(X1,X2,…,Xn)的联合分布密度是各个Xi的边缘分布密度的乘积,即
下面阐述随机向量间的独立性概念。
设两个随机向量(X1,X2,…,Xn)与(Y1,Y2,…,Ym),若对任意的实数x1,x2,…,xn,y1,y2,…,ym,随机事件{X1≤x1,…,Xn≤xn}与随机事件{Y1≤Y1,…,Ym≤ym}总是独立的,即
P{X1≤x1,…,Xn≤xn,Y1≤y1,…,Ym≤ym}
=P{X1≤x1,…,Xn≤xn}·P{Y1≤y1,…,Ym≤ym} (3.19)
用联合分布函数可表作:
(3.20)
则称(X1,X2,…,Xn)与(Y1,Y2,…,Yn)相互独立,简称独立。
关于随机向量间的独立性,以后会常用到以下结论。设(X1,X2,…,Xm)和(Y1,Y2,…,Yn)相互独立,则Xi(i=1,2,…,m)和Yj(j=1,2,…,n)相互独立,又若h,g是连续函数,则h(X1,X2,…,Xm)和g(Y1,Y2,…,Yn)相互独立。