计量经济学
上QQ阅读APP看书,第一时间看更新

§3.1 多元回归模型的定义

一、多元回归模型的意义

我们在第二章中探讨了一元线性回归模型的理论与应用。在一元线性回归模型中,我们假定影响被解释变量的因素只有一个,即解释变量X,这种情形在计量经济分析中往往是不适宜的。因为在经济系统中,影响被解释变量的重要变量往往不止一个。例如在收入-消费模型中,除了收入影响消费外,还有其他因素明显地影响消费,很明显财富就是影响消费的重要变量。在劳动力市场上,影响工资的变量不仅仅是工作年限,受教育程度也是影响工资的一个重要变量。因此,在回归分析模型中,就需要引进更多的解释变量。

多元回归分析与一元回归分析相比有如下优点:

(1)多元回归分析可以研究多个影响因素对被解释变量的影响。

(2)在模型中增加一些有助于解释Y的因素,Y的变动就能更好地予以解释。因此,多元回归分析有助于更好地预测。

(3)多元回归模型更具有一般性。一元回归模型中,只能有一个解释变量,其函数形式不一定恰当。而多元回归模型具有较大的灵活性,有利于对总体回归模型做出正确的判断。

多元回归模型是经济学和其他社会科学进行计量分析时使用最为广泛的一个工具。

二、含有两个解释变量的多元回归模型

含有两个解释变量的多元回归模型是最简单的多元回归模型。模型形式为

其中Yi是被解释变量,X2i和X3i是解释变量,ui是随机干扰项,i指第i项观测。

式(3.1)中的β1是截距顶。表面上看,β1代表X2和X3均取0时的Y的均值,但这仅仅是一种机械的解释,实际上β1是指所有未包含到模型中来的变量对Y的平均影响。系数β2

和β3为偏回归系数,β2表示在保持X3不变的条件下,X2每变化一个单位,Y的均值的变化。类似地,β3表示在保持X2不变的条件下,X3每变化一个单位,Y的均值的变化。

例如在汽车需求分析中,可设定模型为

其中Yt为汽车需求量,Pt为汽车价格,It为居民收入,t代表第t次观测。(3.2)式中,汽车需求量主要受到价格和收入这两个变量的影响。

又如在劳动力市场中,工资水平模型为

其中Wi为工资,ei为受教育水平,EPi为工作经验。式(3.3)表示工资水平主要受受教育水平和工作经验两个变量的影响。

在含有两个解释变量的多元回归模型中,经典线性回归模型的假定条件如下:

假定1 ui零均值,即

假定2 ui无序列相关,即

假定3 ui同方差,即

假定4 ui与每一个解释变量无关,即

假定5 无设定偏误。

假定6 解释变量X之间无完全的共线性。即X2与X3之间无完全的共线性关系。

无完全的共线性的含义是,不存在一组不全为零的数λ2和λ3,使得

如果这一关系式存在,则该X2和X3是共线的或线性关系。例如,X2i=2X3i或X2i+X3i=0,则两变量就是完全线性关系。

三、含有多个解释变量的模型

多个解释变量的多元回归模型是一元回归模型和二元回归模型的推广。含被解释变量Y和k-1个解释变量X2,X3,……,Xk的多元总体回归模型表示如下:

其中β1为截距,β2,β3,……,βk为偏斜率系数,u为随机干扰项,i为第i次观测。式(3.9)的均值表达式为

把式(3.10)表示为增量形式则为

X2的系数β2的意义为:在所有其他变量X3i,X4i,……,Xki保持不变的条件下,X2改变一个单位而导致Yi的均值的变化量。即在保持X3,X4,……,Xk不变的条件下,有

其他斜率系数的意义与此类似。

例如,在汽车需求分析中,要研究竞争性市场中某一品牌汽车的需求。据需求理论,影响汽车需求的因素除了价格和收入外,还有与之竞争的其他品牌汽车的价格。因此,该品牌汽车的需求模型为

其中Yt为某品牌汽车需求量,Pt为该品牌汽车价格,It为居民收入为竞争性品牌汽车价格。

β2代表当居民收入It与竞争性品牌汽车价不变时,该品牌汽车价格降低1元,需求量增加的数量。

对于含有多个解释变量的总体回归模型,经典假定表述如下:

假定1 E(ui)=0。

假定2 Cov(ui,uj)=0,其中i≠j。

假定3 Var(ui)=σ2

假定4 X2,X3,……,Xk是非随机变量,且Cov(ui,Xj)=0,其中j=2,3,……,k。

假定5 X2,X3,……,Xk之间无完全的多重共线性。

假定6 无设定偏误。

假定7 为了假设检验ui~N(0,σ2)。

四、多元线性回归模型的矩阵表达

对总体回归模型(3.9)做n次观测,可以得到样本数据形式的多元线性回归模型。这个模型包括n个方程和k个未知参数β1,β2,……,βk,即

(3.14)式的矩阵表达式为

其中

这里,Y是被解释变量观测值的n×1阶列向量,X是解释变量观测值的n×k阶矩阵,矩阵的每个元素Xji表示第j个变量的第i个观测值。矩阵的每一列表示一个解释变量的n个观测值,截距项β1对应的观测值均为1,β是未知参数的k×1阶列向量,U是随机误差项的n×1阶列向量。

与一元回归相同,据样本观测值就可以得到样本回归函数。假设得到了未知参数β1,β2,……,βk的估计值,……,,则样本回归函数可表示为

其随机表达式为

式(3.16)和(3.17)的矩阵表达式分别为

其中

这里,是被解释变量Y的n×1阶拟合值列向量;是未知参数β的k×1阶估计值列向量;e是残差e的n×1阶列向量。

经典假定的矩阵表达如下:

假定1 ui(i=1,2,……,n)零均值假定

假定2 ui无序列相关假定

假定3 ui同方差假定

假定2和假定3的矩阵表达式是

称Var(U)为随机误差项向量U的方差-协方差矩阵。

假定4 ui与每一个解释变量无关

假定5 无设定偏误。

假定6 解释变量X之间无完全的共线性,解释变量的样本观测矩阵X是满秩矩阵,即R(X)=k。