上QQ阅读APP看书,第一时间看更新
入门篇
第1章 全书指南
作为全书的起始章节,本章将对若干重要知识点做背景介绍。这些核心的知识点包括Python编程、数据分析、机器学习、Kaggle竞赛,以及Git代码管理。为了达成“从零开始,依托Python编程环境下的数据分析与机器学习知识和工具,熟练实践于Kaggle竞赛”的目标,本章提供全书的一站式指南如下。
首先,从Python 3的基础编程开始学习,然后过渡到利用Pandas从事数据分析和使用Scikit-learn完成经典的单机(单核/多核)机器学习任务。
而后,进阶学习基于PyTorch/TensorFlow/PaddlePaddle的深度神经网络的搭建、训练和评估方法;以及基于PySpark-ML的分布式机器学习实践。
最终,灵活运用上述知识和工具,解决Kaggle竞赛平台上的若干经典问题。并学会使用Git工具,将自己的代码成果在云端(如Gitee或者GitHub平台上)安全地存储,保证能够在任何本地计算机上随时更新和同步管理。