机器学习算法评估实战
上QQ阅读APP看书,第一时间看更新

第2章 一个好的回归算法

回归算法也是很常用的一类算法,主要用于趋势预测。

分类算法和回归算法的区别主要体现在以下3个方面。

(1)输出的数据类型不一样

分类算法输出的数据类型是离散数据,也就是分类的标签。比如我们预测学生考试是否通过,预测结果是“考试通过”,或者是“考试不通过”,这就是离散数据。

回归算法大部分时候输出的数据类型是连续数据。如我们通过学习时间预测学生的考试分数,这里的考试分数是连续型数据。

(2)训练得到的模型不一样

分类算法得到一个决策面,用于对数据集中的数据进行分类。

回归算法得到一个最优拟合线,这个线条可以更好地接近数据集中的各个点。

(3)评估模型的指标不一样

在分类算法中,通常会将准确率作为指标,也就是预测结果中分类正确的数据占总数据的比例。

在回归算法中,我们用平均误差或者方差、偏差等指标来评估模型的好坏。

通过以上比较分析,我们可以看出,分类算法的评估指标在回归算法上一般是不适用的。本章我们就来看一看有哪些属于回归算法的评估指标。