上QQ阅读APP看书,第一时间看更新
第2章 一个好的回归算法
回归算法也是很常用的一类算法,主要用于趋势预测。
分类算法和回归算法的区别主要体现在以下3个方面。
(1)输出的数据类型不一样
分类算法输出的数据类型是离散数据,也就是分类的标签。比如我们预测学生考试是否通过,预测结果是“考试通过”,或者是“考试不通过”,这就是离散数据。
回归算法大部分时候输出的数据类型是连续数据。如我们通过学习时间预测学生的考试分数,这里的考试分数是连续型数据。
(2)训练得到的模型不一样
分类算法得到一个决策面,用于对数据集中的数据进行分类。
回归算法得到一个最优拟合线,这个线条可以更好地接近数据集中的各个点。
(3)评估模型的指标不一样
在分类算法中,通常会将准确率作为指标,也就是预测结果中分类正确的数据占总数据的比例。
在回归算法中,我们用平均误差或者方差、偏差等指标来评估模型的好坏。
通过以上比较分析,我们可以看出,分类算法的评估指标在回归算法上一般是不适用的。本章我们就来看一看有哪些属于回归算法的评估指标。