本章主要用于介绍常见的数据挖掘领域的机器学习算法,讲解次序从易到难,从最简单的线性回归、逻辑回归、K均值聚类算法讲到较难的xgboost、GBDT算法等。这些算法都是工业界常用的算法,算法的原理、细节和区别都是笔试面试的重要考点。为了能够更准确地掌握这些内容,除了学习本章内容之外,还应当深入阅读相关算法(例如XGBoost)所对应的论文以及在真实数据集上实现算法并深入了解参数细节。