§3.4 回归模型的函数形式
在前面所用的回归分析中,除工资模型外,被解释变量与解释变量的关系均为线性关系,即被解释变量对解释变量的一阶导数均为常数。但是在经济系统中,这种线性关系并不能满足要求,我们要用到许多变量间非线性关系的回归模型。例如,工资决定模型的被解释变量就是对数形式。对于多数非线性模型,我们都可以通过重新定义被解释变量和解释变量把非线性模型转换为线性回归模型。
在此,我们主要讨论如下四种形式的回归模型:(1)对数线性模型;(2)半对数模型;(3)双曲线模型;(4)多项式模型。
一、对数线性模型
1.双对数线性模型
在进行某商品的市场需求分析时,我们知道价格是影响需求量的重要因素,故设定如下模型:
其中Yi为需求量,Xi为价格,e≈2.718为自然对数的底。对(3.68)式取对数可得
式中ln表示以e为底的自然对数。
令α=lnβ1,则式(3.69)可表达为
该模型中lnYi对α,β2是线性关系,lnYi对lnXi也是线性关系。该模型可称为双对数线性模型,简称为对数线性模型。
令则式(3.70)可表达为
如果式(3.71)满足经典假定,我们就可以使用普通最小二乘法估计参数α和β2,并且得到的估计量和分别是α和β2的最佳线性无偏估计量。
对数线性模型的优点在于:斜率系数β2度量了Y对X的弹性,也就是当解释变量X变化1%时,Y变化的百分比。模型中X代表价格,Y代表需求量,预期价格弹性β2<0。因此,β2就代表当价格X上涨或下调1%时,需求量下降或上涨的百分比。在式(3.71)中,取lnY对lnX的导数可得
由于在线性回归模型中,β2是一个常数,因此,对数线性模型假定Y与X之间的弹性数β2在整个研究范围内保持不变,所以称为不变弹性模型。如果X=1%,即解释变量变1%,则Y的变化为β×1%=β%。
对数线性模型的多元回归模型为
其中β2,β3,……,βk分别为Y对X2,X3,……,Xk的弹性。
在回归分析中使用对数线性模型的优点和规则:
对数线性模型的优点
(1)对数线性模型中斜率系数度量了一个变量(Y)对另一个变量(X)的弹性。
(2)斜率系数与变量X, Y的测量单位无关,其结果值与X, Y的测量单位无关。
(3)当Y>0时,使用对数形式lnY比使用水平值Y作为被解释变量的模型更接近经典线性模型。大于0的变量,其条件分布常常是有异方差性或偏态性;取对数后,虽然不能消除这两方面的问题,但可大大弱化这两方面的问题。
(4)取对数后会缩小变量的取值范围。使得估计值对被解释变量或解释变量的异常值不会很敏感。
对数线性模型的经验法则
对于何时取对数并不存在一个固定模式,但有一些经验法则:
(1)对于大于0的数量变量,通常均可取对数。例如,需求量、价格、工资等。
(2)以年度量的变量,如受教育年数、工龄、年龄等则通常以其原有形式出现。
(3)以比例或百分比度量的变量,如失业率、通货膨胀率、犯罪率等变量即可使用原形式也可使用对数形式。但两种使用方法中参数的意义不同。
(4)使用对数时,变量不能取0或负值。
例3.6 美国咖啡需求函数(1970—1980年)。
表3.2给出了美国1970—1980年的咖啡需求量和实际价格水平资料。
表3.2 1970—1980年美国咖啡需求量(Y)和实际价格(X)
在该需求函数中,我们要用需求的价格弹性来解释价格对需求量的影响,因此,我们采用对数线性模型:
使用普通最小二乘法,得到如下的样本回归模型:
其中Yt为咖啡消费,Xt为咖啡实际价格。
从样本回归模型可以看出,咖啡需求的价格弹性为-0.25。就是说,在1970—1980年的样本期内,咖啡每磅实际价格每增加1%,咖啡需求量(每日饮用咖啡的杯数)平均减少0.25%。因为咖啡价格弹性的绝对值小于1,所以说咖啡的需求是价格非弹性的。
2.单对数模型
(1)对数到线性模型
在经济系统中,人们用GDP、失业、进出口、投资、人口等指标的增长率来描述经济系统的发展状态。对数线性模型为我们提供了方便,该类对数线性模型为
其中Yt为要研究的经济现象,t为时间变量。
时间变量t的使用,主要是研究被解释变量在时间上的变动规律。例如,我们常常要研究GDP、就业、失业、股票价格等经济现象在一定时期内的变化规律。
在式(3.76)中,被解释变量为对数形式,解释变量为线性形式,称为对数到线性的单对数模型,简称对数到线性模型。式(3.76)的通用形式为
其中斜率系数β2的含义为:解释变量X绝对量改变一个单位时,被解释变量Y的相对改变量,即
对于式(3.78),当ΔX=1时,Y的相对变化当ΔX=1%时,即X增加1个百分点,Y的相对变化
对于式(3.78),如果Yt为国内生产总值,取Δt=1,则
很显然,β2代表经济增长率。
例3.7 利用表3.3中实际GDP数据,取时间变量t=1,2,……,15,得到中国2000—2014年的经济增长模型为
式(3.80)的中国经济增长模型说明在2000—2014年期间,中国实际GDP每年增长9.80%。
表3.3 2000—2014年中国实际GDP
(2)线性到对数模型
类似于对数到线性的单对数模型,如果我们想测度解释变量的相对改变量对被解释变量的绝对改变量的影响,就需要使用解释变量是对数形式、被解释变量是线性形式的回归模型。
我们称式(3.81)为线性到对数模型。模型中斜率系数β2的含义为解释变量X相对量改变1个单位时,被解释变量Y的绝对变化量,即
当ΔX/X=0.01=1%时,ΔY=0.01β2,即当解释变量X增加1%时,被解释变量Y增加的绝对量为0.01β2。
例3.8 中国能源消费对GDP的影响(2000—2014年)(见表3.4)。
表3.4 2000—2014年中国能源消费与GDP
注:表中数据来源于《中国统计年鉴》,实际GDP为2000年可比价指标。
为了研究能源增长的相对变化对经济总量GDP增长的影响,可使用对数到线性模型(为了说明对数到线性回归模型的应用,此处使用了也许不恰当的一元回归模型)。
其中Y为国内生产总值(亿元),X为能源消费总量(万吨标准煤)。
利用表3.4中数据,使用普通最小二乘法,可得回归模型:
回归模型(3.85)中,斜率系数是高度显著的,=230 605.1说明在2000—2014年期间,能源消费量每增加1%,国内生产总值平均增长2306.051亿元。
二、倒数模型
当解释变量以倒数形式出现时的模型称为倒数模型或双曲线模型,例如
式(3.86)中,Y对X是非线性,但对参数β1,β2而言是线性的,Y对也是线性的。此模型的特点为当X值趋向于无穷大时,β2趋向于0,Y趋向于β1.
双曲线模型主要有以下三种形式,如图3.1所示:
图3.1 倒数模型图
图3.1(a)可用来描述平均总成本曲线,单位固定成本随着产量X的增加而下降。
图3.1(b)可用来描述宏观经济学中著名的菲利普斯曲线(Phillips curve)。在工资变化率Y随失业率X的变化中,存在两个明显不同的阶段。在失业率X低于自然失业率X0时,由失业率的单位变化引起的工资变化要快于当失业率高于自然失业率X0时由失业率的同样的变化引起的工资变化。β1表示工资变化率的渐近底线。
图3.1(c)可用来描述恩格尔支出曲线。如令Y为对某一商品的支出,X为收入,则某些商品具有如下特性:(1)收入上存在一个临界水平。当收入低于此水平时,消费者就不会购买该商品,这个临界水平就是图3.1(c)中的-β2/β1;(2)消费上有一饱和水平,当消费达到这一水平时,无论消费者收入有多高,都不会多购买一点。这个饱和水平就是图中的渐近线β1.
三、多项式模型
多项式模型在研究成本和生产函数的计量经济分析中有较大的应用价值。边际成本曲线和平均总成本曲线均为U形曲线,我们必须用二次曲线去描述它。
式(3.87)称为二次函数或二次多项式。对于更加复杂的总产量曲线和总成本曲线,可使用三次多项式去描述,即
式(3.88)称为三次函数或三次多项式。
例3.9 总成本函数。
表3.5给出了某产品的产量和总成本数据。
表3.5 产量与总成本
使用表3.5中的数据绘制散点图,如图3.2所示。由图3.2可以看出,总成本与总产出之间的关系为一条拉长的S曲线,因此需要用三次多项式来描述它。
其中Y为总成本,X为产量。
图3.2 总成本曲线
利用表3.5中的数据,使用普通最小二乘法,得到如下的回归模型:
模型中各偏回归系数均显著,拟合优度很高,是个较优良的总成本函数。