第一节 概率基础
一、概率与随机变量的含义、计算和原理
1概率
(1)概率的定义
在数学上,概率测度P是定义在样本空间子集族上的函数。样本空间S上的概率测度P满足以下概率公理:
①对于任意的事件A⊂S,0≤P(A)≤1,表示一个事件的概率必定在0和1之间;
②P(S)=1,表示样本空间S包含所有可能的结果,事件S是必然事件,概率为1;
③如果A∩B=∅,则表示事件A和事件B互斥,那么两个事件至少有一个发生的概率等于两个事件的概率和,即P(A∪B)=P(A)+P(B)。
(2)概率的性质
①P(∅)=0。
②有限可加性:若A1,A2,…,An是两两互不相容的事件,则有
P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)
③设A,B是两个事件,若A⊂B,则有
P(B-A)=P(B)-P(A)
P(B)≥P(A)
④对于任一事件A,0≤P(A)≤1。
⑤加法公式:对于任意两事件A,B有
P(A∪B)=P(A)+P(B)-P(A∩B)
⑥逆事件概率:对于任一事件A,有
P()=1-P(A)
(3)条件概率与事件独立
①条件概率
在给定事件B已经发生的条件下事件A发生的概率为条件概率,记为P(A|B),则有
P(A|B)=P(A∩B)/P(B)
②事件独立
如果P(AB)=P(A)P(B),那么事件A和事件B是相互独立的。
2随机变量
随机变量是从样本空间到实数集的一个函数。
(1)离散型随机变量及其概率分布函数
设随机变量X取值为有限个或者可列无限多个,则随机变量X为离散型随机变量,P(X=xi)=pi,i=1,2,…,n,称为随机变量X的(概率)分布。
(2)随机变量的分布函数
设X是一个随机变量,x是任意实数,函数
F(x)=P{X≤x},-∞<x<∞
称为X的分布函数。
(3)连续型随机变量与概率密度函数
①连续型随机变量
如果对于随机变量X的分布函数F(x),存在非负可积函数f(x),使对于任意实数x有:
则称X为连续型随机变量,f(x)称为X的概率密度函数,简称概率密度。
②概率密度函数的性质
a.对于所有的x∈R,有f(x)≥0;
b.
c.对于任意两个实数a、b,-∞<a<b<∞,有
d.若f(x)在点x处连续,则有f(x)=dF(x)/dx=F′(x)。
3随机变量的数字特征
(1)数学期望
①定义
如果X为离散型随机变量,它的分布为P(X=xi)=pi,i=1,2,…,n,它的期望值为
如果X是一个连续型随机变量,它的概率密度函数为f(x),那么它的期望值为
②性质
a.如果a和b是两个常数,那么E[aX+b]=aE[X]+b;
b.对于X的某个函数g(X)的数学期望,如果X是一个离散型随机变量,那么
如果X是一个连续型随机变量,那么
(2)方差与标准差
X的方差记为σ2或Var(X),并且有:
σ2=E{[X-E(X)]2}=E(X2)-[E(X)]2
方差的平方根称为标准差,标准差可用于衡量随机变量波动程度。
二、多元分布函数及其数字特征
1多元分布函数
(1)离散型随机变量的分布
如果X和Y是两个离散型随机变量,其所有可能取值为(xi,yj),i,j=1,2,…,记P{X=xi,Y=yj)=pij,i,j=1,2,…,则由概率的定义有pij≥0,
称P(X=xi,Y=yj)=pij,i,j=1,2,…为二维离散型随机变量(X,Y)的分布律,或称为随机变量X和Y的联合分布律。
离散型随机变量X和Y的联合分布函数为
其中和式是对一切满足xi≤x,yi≤y的i,j来求和的。
(2)连续型随机变量的分布
①如果X和Y是两个连续型随机变量,那么满足下列性质的二元函数f(x,y)被称为X和Y的联合概率密度函数:
a.f(x,y)≥0;
b.设A是xoy平面上的区域,点(X,Y)落在A内的概率为:P[(X,Y)∈A]=∬f(x,y)dxdy;
c.
②相应的联合累积分布函数为:
③如果F(x,y)的偏导数存在,那么联合密度函数为:
④X和Y的边缘概率密度函数为:
⑤当两个随机变量为相互独立时,联合概率密度是各个边缘概率密度的乘积,即f(x,y)=g(x)·h(y)。
2多元分布函数的数字特征
(1)协方差
协方差用于描述两个随机变量之间相关程度。两个机变量X与Y之间的协方差Cov(X,Y)定义为:
Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)
如果X和Y是相互独立的,那么Cov(X,Y)=0。
(2)协方差矩阵
对于多元随机变量而言,用X表示随机变量组成的向量,即:
其中E(Xi)=μi,var(Xi)=σi2,cov(Xi,Yj)=σij。
①X的期望值:
②随机向量X的协方差矩阵如下:
X的协方差矩阵记为∑X,它是一个对称矩阵。
三、随机变量的函数
一个随机变量经过函数变换后仍是一个随机变量,并且通过原始随机变量的分布可得到新随机变量的概率分布。
1随机变量的线性组合
如果a1,a2,…,an是常数,X1,X2,…,Xn是随机变量,那么有:
特别地有:
Var(a0+a1X1)=a12Var(X1)
Var(X1±X2)=Var(X1)+Var(X2)±2Cov(X1,X2)
2随机变量的加权和
如果α′=(α1,α2,…,αn)是常数向量,那么有:
E(α′X)=α′μ=α1μ1+α2μ2+…+αnμn
如果αi是资产组合的权重,μi是资产组合收益率,σi是资产组合波动率,上述结果就是资产组合收益率的期望和方差的计算公式,可用于计算组合风险价值。
3随机变量的积
对于随机变量乘积Y=X1X2,其期望为:E(X1X2)=E(X1)E(X2)+Cov(X1,X2)
4随机变量变换(函数)的分布
假设X是一个连续随机变量,概率密度函数为f(x),g(X)是一个单调函数,那么Y=g(X)是一个新的随机变量。把X表述成Y的函数为X=w(Y),那么Y的概率密度函数h(y)为:
h(y)=f[w(y)]·|∂w(y)/∂y|
四、几个重要分布
1对数正态分布
如果一个随机变量X的对数形式Y=ln(X)是正态分布,则称这一变量服从对数正态分布。对数正态分布的密度函数为:
对数正态分布变量X的均值和方差分别为:
2卡方(χ2)分布
一个标准正态随机变量的平方服从自由度为1的χ2分布。即如果Z~N(0,1),那么Z2~χ2(1)。如果Z1,Z2,…,Zn是相互独立的标准正态分布,那么Y=Z12+Z22+…+Zn2~χ(n)2。
3t分布
(1)如果Z~N(0,1),χ2(r)表示自由度为r的服从χ2分布的随机变量,Z和χ2(r)是相互独立的,那么服从自由度为r的t分布,记为T~t(r)。
(2)t分布的基本性质如下:
①t分布的的概率密度函数图像关于y轴对称;
②E(r)=0,Var(T)=r/(r-2)(r>2);
③当r趋于无穷大时,T的分布趋于标准正态分布。
4F分布
如果χ2(r1)和χ2(r2)是相互独立的、自由度分别为r1和r2的卡方随机变量,那么
服从自由度为r1和r2的F分布,记为F~F(r1,r2)。