更新时间:2020-04-22 12:26:31
封面
版权信息
作者简介
译者介绍
数字版权声明
版权声明
O'Reilly Media Inc.介绍
赞誉
译者序
前言
学习数据科学的概念性方法
写给教师们
其他技能及概念
本书结构及体例
示例的使用
SafariBooks Online
联系我们
致谢
电子版
第1章 绪论:数据分析式思维
1.1 数据机遇无处不在
1.2 案例:飓风Frances
1.3 案例:预测用户流失
1.4 数据科学、数据工程和数据驱动型决策
1.5 数据处理和“大数据”
1.6 从大数据1.0到大数据2.0
1.7 数据与数据科学能力:一种战略性资产
1.8 数据分析式思维
1.9 关于本书
1.10 重新审视数据挖掘和数据科学
1.11 数据科学:一门新兴的实验性学科
1.12 小结
第2章 商业问题及其数据科学解决方案
2.1 从商业问题到数据挖掘任务
2.2 有监督方法与无监督方法
2.3 数据挖掘及其结果
2.4 数据挖掘流程
2.5 管理数据科学团队的含义
2.6 其他分析技巧与技术
2.7 小结
第3章 预测建模导论:从相关性到有监督的划分
3.1 建模、归纳与预测
3.2 有监督的划分
3.3 划分的可视化
3.4 把树视作规则组
3.5 概率估计
3.6 示例:用树型归纳解决用户流失问题
3.7 小结
第4章 用模型拟合数据
4.1 根据数学函数分类
4.2 通过数学函数进行回归
4.3 类概率估计和逻辑“回归”
4.4 示例:对比逻辑回归和树型归纳
4.5 非线性函数、支持向量机和神经网络
4.6 小结
第5章 避免过拟合
5.1 泛化能力
5.2 过拟合
5.3 过拟合检验
5.4 示例:线性函数的过拟合
5.5 *示例:过拟合为何有害
5.6 从保留评估到交叉验证
5.7 用户流失数据集回顾
5.8 学习曲线
5.9 避免过拟合与控制复杂度
5.10 小结
第6章 相似性、近邻和簇
6.1 相似性和距离
6.2 最近邻推理
6.3 与相似性和最近邻相关的一些重要技术细节
6.4 聚类
6.5 退一步:解决业务问题与数据探索
6.6 小结
第7章 决策分析思维(一):如何评估一个模型
7.1 对分类器的评估
7.2 分类问题的推广
7.3 一个重要的分析框架:期望值
7.4 评估、基线性能以及对数据投资的意义
7.5 小结
第8章 模型性能的可视化
8.1 排序,而不是分类
8.2 利润曲线
8.3 ROC图像和曲线
8.4 ROC曲线下面积
8.5 累积响应曲线和提升曲线
8.6 示例:用户流失模型的性能分析
8.7 小结
第9章 证据和概率
9.1 示例:向线上目标用户投放广告
9.2 根据概率合并证据
9.3 将贝叶斯法则应用到数据科学中
9.4 证据“提升度”的模型
9.5 示例:Facebook“点赞”的证据提升度
9.6 小结
第10章 文本的表示和挖掘
10.1 为什么文本很重要
10.2 为什么文本很难处理
10.3 表示法
10.4 示例:爵士音乐家
10.5 *IDF和熵的关系