更新时间:2021-12-15 16:01:03
封面
版权页
内容概述
前言
第1章 初识大数据
1.1 大数据产生的背景
1.2 大数据的结构与特征
1.3 大数据相关概念
1.4 大数据可视化
1.5 大数据相关工具
1.6 大数据时代的新机遇
1.7 本章小结
1.8 习题
第2章 大数据处理架构Hadoop
2.1 Hadoop简介
2.2 Hadoop发展史及特点
2.3 Hadoop体系结构
2.4 配置Linux环境
2.5 Hadoop环境搭建
2.6 Hadoop关键组件
2.7 本章小结
2.8 习题
第3章 分布式文件系统HDFS
3.1 HDFS概念
3.2 HDFS体系结构
3.3 HDFS文件存储机制
3.4 HDFS的数据读写过程
3.5 HDFS应用实践
3.6 本章小结
3.7 习题
第4章 计算系统MapReduce
4.1 MapReduce概述
4.2 MapReduce架构
4.3 MapReduce接口类
4.4 MapReduce应用案例——单词计数程序
4.5 本章小结
4.6 习题
第5章 分布式数据库HBase
5.1 初识HBase
5.2 HBase安装与配置
5.3 Hbase的存储结构
5.4 HBase的实现原理
5.5 HBase表结构设计
5.6 本章小结
5.7 习题
第6章 NoSQL数据库
6.1 NoSQL简介
6.2 NoSQL技术基础
6.3 NoSQL的类型
6.4 NoSQL典型工具
6.5 本章小结
6.6 习题
第7章 集群计算Spark
7.1 深入理解Spark
7.2 Spark的安装与配置
7.3 Spark程序的运行模式
7.4 Spark编程实践
7.5 Spark的三个典型应用案例
7.6 本章小结
7.7 习题
第8章 流计算Storm
8.1 流计算概述
8.2 开源流计算框架Storm
8.3 实时计算处理流程
8.4 典型的流引擎Spark Streaming
8.5 流计算的应用案例——电商实时销售额的监控
8.6 本章小结
8.7 习题
第9章 分布式协调系统ZooKeeper
9.1 ZooKeeper概述
9.2 ZooKeeper的安装和配置
9.3 ZooKeeper的简单操作及步骤
9.4 ZooKeeper Shell操作
9.5 ZooKeeper API操作
9.6 ZooKeeper应用案例——Master选举
9.7 本章小结
9.8 习题
第10章 销售数据分析系统
10.1 数据采集
10.2 在HBase集群上准备数据
10.3 安装Phoenix中间件
10.4 基于Web的前端开发
10.5 本章小结
10.6 习题
第11章 交互式数据处理
11.1 数据预处理
11.2 创建数据仓库
11.3 数据分析
11.4 本章小结
11.5 习题
第12章 协同过滤推荐系统
12.1 推荐算法概述
12.2 协同过滤推荐算法分析
12.3 Spark MLlib推荐算法应用
12.4 本章小结
12.5 习题
附录 课后习题答案
参考文献
封底