中国粮食需求中长期趋势研究
上QQ阅读APP看书,第一时间看更新

第三节 预测分析方法

迄今为止,众多的学者和机构利用不同的预测方法对中国粮食需求问题进行了研究,但是至今还没有任何一种方法或模型被学术界公认为是最理想的、最完美的方法或模型,即便是复杂程度较高的模型也不一定能保证预测精度(徐国祥,2005),因此,对于中长期粮食需求预测,不能过多地计较其具体结论数值,而要更多地注意通过研究结论所反映出来的变化趋势。当然,虽然中长期粮食需求预测结果的精度难以保证,但是通过对研究问题的深入把握,科学设置研究假定,仍能提高数据可靠性和模型估计技术的科学性,预测结果也是较为合理可靠的。本研究运用GM(1, 1)新陈代谢模型预测中国中长期粮食需求总量,利用对数线性需求函数建立结构化模型对具体粮食品种需求情况进行分析。

一 灰色系统理论

对客观事物的本质进行认识,首先必须把握这个事物的整体,这就是系统的观点。任何系统都包含若干子系统,同时被若干子系统包围,是复杂的、多层次的子系统的集合。系统的性能由这些子系统之间的关系决定,系统性能或本质有时发生变化,成为新的系统,新系统与外界会重新建立相对平衡关系。研究系统的理论和方法很多,灰色系统理论由“黑箱”和“灰箱”演变而来,1953年英国科学家A. Bsio用闭盒与黑盒来称呼内部信息未知的对象。自此以后,人们就把内部特性已知的信息系统,称为白色系统;把未知的信息系统,称为黑色系统;把既含有已知的又含有未知的信息系统,称为灰色系统。也就是说,灰色系统是指既含有已知的又含有未知的信息的系统。灰色系统理论由华中科技大学邓聚龙教授创立于1982年,运用控制论和运筹学相结合的数学方法来解决贫信息系统的问题,提供了解决系统问题的新途径。贫信息或者灰信息的系统,都称为灰色系统,利用灰色系统中的离乱观测数据,可以建立系统的灰色模型,当系统的概率特性或隶属特性不能确定时,灰色系统模型就显现出突出的优越性。

建模是灰色系统的基础工作,针对时间序列的GM(Grey Model)建模是灰色系统建模中最具特色的部分,利用系统信息使抽象的概念量化,量化的概念模型化,最后进行模型优化,直接将时间序列数据化转化为微分方程。灰色系统理论认为非确定性量是灰色量,用灰色理论进行处理,可以尽可能真实地描述客观事物的运行规律。根据过去及现在已知的或非确知的信息,建立一个从过去推测将来的GM模型,确定系统在未来发展变化的趋势,这个过程叫作灰色预测。而灰色预测的类型很多,本研究中用到的灰色预测模型为等时间间隔的数列预测模型,其预测步骤如下。

假定原始数列序列为:

X(0)t)=(x(0)(1), x(0)(2), …, x(0)n))

X(0)t)进行累加,得到新数列:

X(1)t)=(x(1)(1), x(1)(2), …, x(1)n))

构造矩阵BYn

则GM(1, 1)模型x(0)k)+az(1)k)=b的最小二乘估计参数列满足:

建立GM(1, 1)模型:

白化方程的解,也称时间响应函数为:

GM(1, 1)模型x(0)k)+az(1)k)=b的时间响应序列为:

还原值为:

二GM(1, 1)三大检验方法

(1)残差检验

利用公式可以得到原始数列与预测数列的绝对误差数列,其中,t=1, 2, …, n,相对误差et)=q(0)t/x(0)t),拟合精度,若 et)≤0.08或者 p0≥92%,则认为模型可以通过检验。

(2)关联度检验

预测数列:,, …,

与原数列:x(0)k)={x(0)(1), x(0)(2), …, x(0)n)}的关联系数为:

那么关联度为:

其中,ρ为分辨率,一般取ρ=0.5,当ρ=0.5时,r>0.6,则说明预测效果较好。

(3)模型精确度后验残差检验

第一步:求x(0)t)的平均值

第二步:求x(0)t)的方差

第三步:求残差q(0)t)的平均值

第四步:求残差q(0)t)的方差

那么,后验差比值C

C=S2/S1

小误差频率P

估计PC 的大小,预测精度可以分为四个等级。当 P >0.95, C<0.35时,预测精度较高,效果比较好;当 P >0.80, C <0.45时,预测合格;当 P >0.70, C <0.50时,预测勉强通过;当 P≤0.70, C≥0.65时,预测不合格,未通过检验,则可建立残差GM(1, 1)模型进行修正。

GM(1, 1)模型作为一个连续的时间序列,可以从初始值一直扩展到未来的任何时刻,可以进行长期预测,但是随着时间向前推移,预测值的灰区间逐渐增大,对于时序较长的GM(1, 1)模型,必须缩小灰平面,充分利用已知信息,同时不断补充新信息。因此,对于长期预测,可以通过已知数列建立GM(1, 1)模型,当预测每得到一个灰数值时,将其补充到数列,同时将数列最老的数据去掉,这样再建立一个新的GM(1, 1)模型,重新开始预测。这样通过数次预测,就可以完成预测目标,这是一个新陈代谢的过程,因此这种对于GM(1, 1)模型进行改进得到的模型叫作等维新陈代谢GM(1, 1)模型,这种预测方法也被称为等维灰数替补动态预测。

三 线性函数预测方法

(一)线性回归模型

回归分析主要研究客观事物之间的关系,通过对客观事物进行大量实验,寻找那些表面看上去不确定现象中的统计规律。若随机变量y与变量x1, x2, …, xp存在相关关系,则可以建立模型:

y=fx1, x2, …, xp)+ε

上式中,y是因变量,也被称为被解释变量;x1, x2, …, xp是自变量,也被称为解释变量;fx1, x2, …, xp)是回归函数;ε是随机误差,表示随机因素的影响。因变量y由自变量和随机误差一起决定,因变量y与自变量之间存在联系,同时也存在不确定性。根据模型中自变量的个数,可以将回归模型分为一元回归和多元回归。经典线性回归模型有三个基本假设:首先,自变量是确定性变量且彼此不相关,即cov(xi, xj)=0(ij);其次,随机误差项服从相互独立、期望为零、标准差为σ的正态分布,即εiN(0, σ2);最后,样本容量个数多于参数个数。

线性回归模型的一般形式为:

其矩阵形式为:

其中

这里n为样本量,p为自变量个数,y是因变量观测值向量,X为由X的实际观测值构成的矩阵,β为由待估计的参数构成的参数向量,ε为随机误差向量。

线性回归方程的估计一般采用普通最小二乘法(LS),参数估计值为:

模型检验主要包括F检验(方程的显著性检验)和t检验(回归系数的显著性检验)。F检验可以检验模型拟合样本的整体效果,也就是自变量对因变量的解释力度;t检验反映的是每一自变量的合理性。D. W.检验用于检验残差序列的自相关性,不过其只对一阶自相关的检验有效,不能检验残差序列的高阶自相关。R2介于0和1之间,R2越接近1则说明回归拟合效果越好。一般情况下,如果R2的取值超过0.8,则认为模型的拟合优度较高,但由于随着自变量个数的增加,R2逐渐加大,这就可能让使用者错误地认为拟合效果越来越好,为排除R2受自变量个数的影响,引入调整的决定系数,也称其为修正的R2

其中,n为样本个数,p为自变量个数。由于不会随着自变量个数的增加而增大,因此用其判断拟合优度比R2更有效。

(二)对数线性函数模型

需求函数描述了商品的需求量和影响因素之间的关系,线性函数或者可线性化的函数形式可以较方便地利用计量经济学知识对参数进行估计。因此,需求函数模型常采用线性函数模型和对数线性函数模型。由于对数线性函数模型具有较合理的经济解释,参数也具有明显的经济意义,而线性函数模型并不具备这两个优点,所以常常选取对数线性需求函数模型对商品的需求量及其影响因素进行拟合。对数线性模型有如下形式:

在上式中,ln y对于参数b0bp是线性的,而且自变量的对数形式也是线性的。因此,称上述模型为双对数(double-log)模型或对对数模型。

如果我们令y=ln y,,那么对数线性模型就转化为了线性回归模型:

其参数的求解和拟合度的检验等问题均可以按线性回归模型的方法来解决。对于对数线性模型,有

其中,斜率bi度量了y关于xi的弹性,它表示xi变动1%时,y变动了bi%。