线性模型是数据科学领域的基本学习算法。理解线性模型如何工作对于学习数据科学至关重要,因为它是大多数复杂学习算法(包括神经网络)的基本构建模块。
本章将深入讲解数据科学领域的一个著名问题——“泰坦尼克号”示例。介绍这个例子的目的是引入线性模型以进行分类,并让读者看到一个完整的机器学习系统的运行过程,从数据的处理和探索到模型的评估。本章将介绍以下主题。