需求预测和库存计划:一个实践者的角度
上QQ阅读APP看书,第一时间看更新

小贴士 预测准确度的统计

预测准确度有多种统计方法,这里介绍常用的两种。

第一种是平均绝对百分比误差(mean absolute percentage error,MAPE)。这个指标说起来挺拗口,计算起来其实很简单:实际值减去预测值,取绝对值,除以实际值,得到百分比,再对多期的百分比取平均值。这个值很直观,但也容易误导:当实际值非常小,特别是接近0时,这一百分比可能很大;如果实际值是0的话,分母就是0,计算没有意义。解决方案是设定上限,比如平均绝对百分比误差不超过100%。

当然,有人或许会问,为什么是与实际值而不是与预测值比?这是因为你的预测对象是实际值,你当然想跟它越近越好——你的目标是“击中”实际值,而不是预测值。那要比较的话,当然是跟实际发生的比较了,否则跟预测值比较,容易成为“虚对虚”的数字游戏。

第二种是均方误差,亦即文献中经常会看到的MSE(mean squared error)。这是对每期预测值和实际值的差值进行平方,然后再对多期差值的平方取平均值,得到平均均方误差。平方的好处是放大极端误差:误差小了,我们往往可以应对,比如设置安全库存,适当地赶工加急。害死我们的是极端误差——预测过低的话,安全库存很容易被击穿,导致高昂的赶工加急成本;预测过高的话,则容易造成大量的积压,以及由此导致呆滞库存。

对误差进行平方,就是加倍“惩罚”那些极端误差,凸显那些极端虚高或虚低的预测值,也是我们应该重点避免的对象。如图1-2所示,6月份、10月份的绝对误差最大,我们通过平方,加倍“惩罚”这样的极端误差,最终反映在较高的12个月的平均误差中。选择预测方法时,要尽量避免产生大错特错、极端误差的预测模型,用均方误差来量化预测准确度,能较好地排除这样的模型。

图1-2 均方误差示意图

在评判预测模型好坏上,平均绝对百分比误差较直观,但因为其在计算上的问题,往往会误导;均方误差是个更好也更常用的评估指标,但是不够直观。比如在图1-2中,均方误差是4436究竟意味着什么,谁也说不清。不过“不怕不识货,就怕货比货”,在比较不同预测方法时,这一参数却非常有用——均方误差越小,表明预测模型越准确。所以,均方误差最小化是优化预测模型的重要考量。需要注意的是,均方误差最小的时候,平均绝对百分比误差等其他指标并不一定最小;反之亦然。

对于平均绝对百分比误差的误导,我们拿一个具体产品的例子来说明,如表1-2所示。

对这个产品,第一种预测方法是简单指数平滑法,平滑系数为0.3(指数平滑法的细节,我们会在后面讨论);第二种预测方法是移动平均法,采用13周移动平均。基于需求历史,我们首先复盘第1到第13周的需求预测;然后跟每周的实际值来比较,计算每种方法每一周的误差,算出每一周的平均绝对百分比误差、误差的平方;最后取13周平均,得到每种预测方法的平均误差。

如果按照平均绝对百分比误差,移动平均法优于简单指数平滑法,因为简单指数平滑法的平均误差为53%,而移动平均法为47%,后者更小。但从均方误差来判断,结论正好相反。怎么办?让我们回归到预测误差,看两种预测方法下实际的误差对供应链的潜在影响。

如图1-3所示,移动平均法(实线)的误差明显比简单指数平滑法(虚线)的大,表现在极端值更大,上下变动幅度更大,对供应链执行的挑战更大。相反,简单指数平滑法的实际误差更小,变动幅度也更小,而且相对均匀地正负相间。显然,简单指数平滑法是个更好的方法,这跟参照均方误差得出的结论一致。

在学术研究中,均方误差用得很广,用来评判预测准确度。只要你读预测方面的英文著作,MSE是注定不会错过的。我能理解,在实践中,因为通俗易懂,很多时候我们还是用百分比;但在预测方法的择优上,均方误差是个更靠谱的度量方法——你得相信那么多的教授、博士用这种方法,自然是有其原因的。

表1-2 预测准确度的计算示例

注:表中预测值为四舍五入的结果。

图1-3 两种预测方法的误差图

当然,均方误差也有其问题,就是极端值的影响。这些极端值的误差经过平方,会在更大程度上影响结论。对于这些极端值,我们不能简单地剔除了事;相反,我们先得研究为什么会出现,因为这可能掩盖了一些预测模型中没有考虑到的因素。我们后面还会谈到。

实践者问

对于预测准确度,有些采用公式:准确率=1-ABS(实际值-预测值)/预测值,而这里的计算方式却用实际值做分母,两种方法有什么不同吗?

刘宝红答

在我看来,预测的目的是预判将来实际要发生的,尽量让预测靠近实际。所以,判断准确与否,应该跟实际发生的比较。有些公司拿预测值做分母,某种程度上是把预测当作行政命令,分配任务,或者自下而上地承诺,让预测成了目标,驱使大家“说到做到”。这也让预测过程更加“政治化”,加剧了预测过程中的组织博弈。