上QQ阅读APP看书,第一时间看更新
3.5 本章小结
本章介绍了机器学习的分类和常用算法,对最常用的算法原理也做了一些介绍。但是除了最基本的算法,机器学习在实际应用中还有其他需要注意的地方。
机器学习算法的分类是多种多样的,可采用的算法也很多,因此在实际工作中采用何种算法就是一个令程序设计人员非常头疼的问题。
在前文介绍机器学习时已经举了例子,使用线性回归可以量化地计算出房屋面积、卧室与房屋价格之间的关系。也许这个关系不太精确,但是可以较好地反映出各因素之间是否有联系,这一点可以更好地帮助读者对一些不能够直接反映的量转化为量化处理。
除了一般性的训练方法外,线性回归对于特征值的选择也是较为简单的,可以选择一般性的数据作为其计算的特征值,在计算时也应该选择比较容易计算的拟合方程去构建机器学习模型,而线性回归均能够满足。
回到前面介绍的线性回归算法,其好处在于线性回归的计算速度非常快,一般模型建立的时间可以压缩到几分钟,甚至于数百G的网络大数据,也可以在数小时之内完成,这样非常有利于借助分布式系统对大数据进行处理。
此外,对于一些问题的求解,线性回归方法能够获得比其他算法更好的性能。综合起来看,一些问题并不需要复杂的算法模型,而是需要对数据的复杂度和数据集的大小进行综合考虑,这样来看,线性回归模型能够取得更好的整体模型算法效果。