前言
在大数据时代,数据分析是每个职场人士的必备技能。在数据分析领域,Python语言以其简单易用,并提供了优秀、好用的第三方库和数据分析的完整框架而深受数据分析人员的青睐。可以说,Python已经当仁不让地成为了数据分析人员的一把“利器”。程序员想要进入数据分析行业,就要掌握Python数据分析技术,只有这样才能在严峻的就业市场中具有较强的竞争力。
Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,目的在于简单、直观地处理关系型或标记型数据。Pandas的目标是成为Python数据分析实战必备的高级工具,其长远目标是成为最强大、最灵活,可以支持任何语言的开源数据分析工具。
本书结构
本书共14章,具体章节安排如下。
第1章和第2章:讲解Pandas的基础知识和常用数据结构,如Pandas的定义、优势,Anaconda的下载和安装,Jupyter Notebook界面的基本操作,Python的数据结构,NumPy的数据结构和Pandas的数据结构。
第3~6章:讲解Pandas数据分析之前的准备,即Pandas数据的导入、导出、查看、清洗、合并、对比和预处理。
第7~12章:讲解Pandas数据的提取、筛选、聚合函数、分组、透视、统计和可视化。
第13章和第14章:讲解Pandas数据的机器学习算法和Pandas的时间序列数据。
本书特色
本书的特色归纳如下。
实用性:首先着眼于Pandas实战应用,然后探讨深层次的技巧问题。
详尽的实例:每一章都附有大量的实例,通过这些实例介绍知识点。每个实例都是编者精心选择的,读者反复练习,举一反三,就可以真正掌握Pandas实战技巧,达到学以致用的目的。
全面性:包含了Pandas应用的所有知识,即Pandas的基础知识、常用数据结构,Pandas数据的导入、导出、查看、清洗、合并、对比、预处理、提取、筛选、聚合函数、分组、透视、统计、可视化、机器学习算法,Pandas的时间序列数据等。
生动性:在内容表现上,为了能够让读者在学习知识时不至过于枯燥,采用了大量的图表,使整本书的风格生动、形象。
创作团队
本书由周峰、周俊庆编写,其他人员对本书的编写提出了宝贵意见并参与了部分内容的编写工作,他们是周凤礼、陈宣各、周令、张新义、王征、张瑞丽等。
由于时间仓促,加之水平有限,书中的缺点和不足之处在所难免,敬请读者批评指正。
编者
2022.7.18
本书代码下载页面入口:http://www.broadview.com.cn/44070