更新时间:2020-09-18 18:06:13
封面
版权信息
前言
第1章 Python语言基础
1.1 Python语言介绍
1.2 安装Python
1.3 Python开发工具介绍
1.4 认识第一段Python程序
第2章 处理网络数据
2.1 处理HTML和XML数据
2.2 处理HTTP数据
2.3 处理URL数据
2.4 爬取新闻保存到XML文件并分析特征关系
第3章 网络爬虫实战
3.1 网络爬虫基础
3.2 开发简单的网络爬虫应用程序
3.3 使用爬虫框架Scrapy
第4章 处理特殊文本格式
4.1 使用tablib模块
4.2 使用openpyxl处理Office文件
4.3 使用pyexcel处理Office文件
4.4 使用python-docx处理Office文件
4.5 使用xlrd和xlwt读写Excel
4.6 使用xlsxwriter操作Excel文件
第5章 使用数据库保存数据
5.1 操作SQLite3数据库
5.2 操作MySQL数据库
5.3 使用MariaDB数据库
5.4 使用MongoDB数据库
5.5 使用ORM操作数据库
第6章 操作处理CSV文件
6.1 内置CSV模块介绍
6.2 爬取图书信息并保存为CSV文件
6.3 使用CSV文件保存Scrapy抓取的数据
第7章 操作处理JSON数据
7.1 类型转换
7.2 JSON编码和解码
7.3 分析JSON格式的世界人口数据
7.4 挖掘并分析日志文件数据
7.5 统计分析朋友圈的数据
7.6 爬虫抓取照片资料
第8章 使用库matplotlib实现数据可视化处理
8.1 安装库matplotlib
8.2 库matplotlib的基本操作
8.3 绘制随机漫步图
8.4 大数据分析某年最高温度和最低温度
8.5 在Tkinter中使用matplotlib绘制图表
8.6 爬取热门电影信息并制作数据分析饼状图
第9章 使用库pygal实现数据可视化处理
9.1 安装库pygal
9.2 pygal的基本操作
9.3 分析与图书销售相关的数据
9.4 使用pygal分析网络数据
9.5 绘制比特币收盘价数据折线图
第10章 使用库numPy实现数据可视化处理
10.1 库numPy基础
10.2 库numPy通用函数
10.3 联合使用numPy和matplotlib
10.4 大数据分析最受欢迎的儿童名字
第11章 使用库pandas实现数据可视化处理
11.1 安装库pandas
11.2 从CSV文件读取数据
11.3 日期相关操作
11.4 分析服务器日志数据
11.5 使用pandas提取数据并构建Neo4j知识图谱
第12章 大数据实战:电影票房系统
12.1 背景介绍
12.2 需求分析
12.3 模块架构
12.4 爬取数据
12.5 数据分析