更新时间:2020-01-10 15:41:15
封面
版权信息
数字版权声明
作者简介
版权声明
译者序
前言
第1章 开始数据挖掘之旅
1.1 数据挖掘简介
1.2 使用Python和IPython Notebook
1.3 亲和性分析示例
1.4 分类问题的简单示例
1.5 什么是分类
1.6 小结
第2章 用scikit-learn估计器分类
2.1 scikit-learn估计器
2.2 流水线在预处理中的应用
2.3 流水线
2.4 小结
第3章 用决策树预测获胜球队
3.1 加载数据集
3.2 决策树
3.3 NBA比赛结果预测
3.4 随机森林
3.5 小结
第4章 用亲和性分析方法推荐电影
4.1 亲和性分析
4.2 电影推荐问题
4.3 Apriori算法的实现
4.4 抽取关联规则
4.5 小结
第5章 用转换器抽取特征
5.1 特征抽取
5.2 特征选择
5.3 创建特征
5.4 创建自己的转换器
5.5 小结
第6章 使用朴素贝叶斯进行社会媒体挖掘
6.1 消歧
6.2 文本转换器
6.3 朴素贝叶斯
6.4 应用
6.5 小结
第7章 用图挖掘找到感兴趣的人
7.1 加载数据集
7.2 寻找子图
7.3 小结
第8章 用神经网络破解验证码
8.1 人工神经网络
8.2 创建数据集
8.3 训练和分类
8.4 用词典提升正确率
8.5 小结
第9章 作者归属问题
9.1 为作品找作者
9.2 功能词
9.3 支持向量机
9.4 字符N元语法
9.5 使用安然公司数据集
9.6 小结
第10章 新闻语料分类
10.1 获取新闻文章
10.2 从任意网站抽取文本
10.3 新闻语料聚类
10.4 聚类融合
10.5 线上学习
10.6 小结
第11章 用深度学习方法为图像中的物体进行分类
11.1 物体分类
11.2 应用场景和目标
11.3 深度神经网络
11.4 GPU优化
11.5 环境搭建
11.6 应用
11.7 小结
第12章 大数据处理
12.1 大数据
12.2 大数据应用场景和目标
12.3 MapReduce
12.4 应用
12.5 小结
附录 接下来的方向
后记