更新时间:2020-06-05 17:01:05
封面
版权信息
内容简介
前言
第1章 感知数据
1.0 了解数据科学项目
1.1 文件中的数据
1.2 数据库中的数据
1.3 网页上的数据
1.4 来自API的数据
第2章 数据清理
2.0 基本概念
2.1 转化数据类型
2.2 处理重复数据
2.3 处理缺失数据
2.4 处理离群数据
第3章 特征变换
3.0 特征的类型
3.1 特征数值化
3.2 特征二值化
3.3 OneHot编码
3.4 数据变换
3.5 特征离散化
3.6 数据规范化
第4章 特征选择
4.0 特征选择简述
4.1 封装器法
4.2 过滤器法
4.3 嵌入法
第5章 特征抽取
5.1 无监督特征抽取
5.2 有监督特征抽取
附录A Jupyter简介
附录B NumPy简介
附录C Pandas简介
附录D Matplotlib简介
后记
反侵权盗版声明