统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
上QQ阅读APP看书,第一时间看更新

10.15.3 基于得分组的平滑预测与实际值散点图:EDA模型与非EDA模型对比

我们为非EDA模型制作了基于得分组的EDA(FD2_OPEN、MOS_OPEN),见图10.16。在图上看到点的分布明显没有集中在45°线附近。得分组II,III,V和VI都离这条线很远,这些平滑点的相关系数rsm.actual,sm.predicted:scoregroup是0.635。

图10.16 非EDA(FD2_OPEN、MOS_OPEN)模型的得分组平滑预测与实际值散点图

基于得分组的EDA模型和非EDA模型的相关系数比较表明EDA模型可以让平滑点更紧凑地分布在45°线周围,其相关系数明显大于非EDA模型:大了33.5%(=(0.848-0.635)/0.635),表明这个EDA模型有较好的预测质量。