1.3 为什么要将Python作为实现工具
Python作为一门简单、易学、易读、易维护、用途广泛、速度快、免费、开源的主流编程语言,广泛应用于Web开发、大数据处理、人工智能、云计算、爬虫、游戏开发、自动化运维开发等各个领域,是众多高等院校的必修基础课程,也是堪与Office办公软件比肩的职场人士必备技能。Python可以很好地完成数据分析以及机器学习中的数据清洗、特征工程、算法执行、数据可视化等任务,在实务中也得到了非常广泛的应用。因此将Python作为实现工具。
鉴于数据清洗、特征工程与数据可视化在开展数据统计分析和机器学习建模中的重要性,以及Python语言具备的种种优势,因此非常有必要创作《Python数据科学应用从入门到精通》。本书既可以单独使用,使读者能够掌握数据清洗、特征工程、数据可视化、数据挖掘与建模的相关知识与Python的常用操作,也可以作为《Python机器学习原理与算法实现》(杨维忠、张甜著,清华大学出版社,2023年)的姊妹篇,使读者能够掌握更加完整的机器学习应用技能,开展数据统计分析。
需要说明的是,Python是一门应用广泛的编程语言,在不同的应用领域需要掌握的侧重点也不尽相同,因为本书的主题是“Python数据科学应用从入门到精通”,目的在于使读者通过学习本书就能掌握数据清洗、特征工程、数据可视化、数据挖掘与建模的相关技能,所以本书针对Python的介绍,一方面是通用的Python入门基础,包括Python概述,Anaconda平台的下载与安装,Python注释、基本输出与输入,Python变量和数据类型,Python数据运算符,Python序列的概念及通用操作,Python列表,Python元组,Python字典,Python集合,Python字符串等基本概念与语法知识;另一方面是与数据清洗、特征工程、数据可视化、数据挖掘与建模最为紧密相关的一些内容,相关知识有机融合于各个章节。