更新时间:2022-05-09 14:25:40
封面
版权信息
内容提要
前言(第3版)
第一篇 大数据基础
第1章 大数据概述
1.1 大数据时代
1.2 大数据的概念
1.3 大数据的影响
1.4 大数据的应用
1.5 大数据关键技术
1.6 大数据计算模式
1.7 大数据产业
1.8 大数据与云计算、物联网
1.9 本章小结
1.10 习题
第2章 大数据处理架构Hadoop
2.1 概述
2.2 Hadoop生态系统
2.3 Hadoop的安装与使用
2.4 本章小结
2.5 习题
实验1 熟悉常用的Linux操作和Hadoop操作
第二篇 大数据存储与管理
第3章 分布式文件系统HDFS
3.1 分布式文件系统
3.2 HDFS简介
3.3 HDFS的相关概念
3.4 HDFS体系结构
3.5 HDFS的存储原理
3.6 HDFS的数据读写过程
3.7 HDFS编程实践
3.8 本章小结
3.9 习题
实验2 熟悉常用的HDFS操作
第4章 分布式数据库HBase
4.1 概述
4.2 HBase访问接口
4.3 HBase数据模型
4.4 HBase的实现原理
4.5 HBase运行机制
4.6 HBase编程实践
4.7 本章小结
4.8 习题
实验3 熟悉常用的HBase操作
第5章 NoSQL数据库
5.1 NoSQL简介
5.2 NoSQL兴起的原因
5.3 NoSQL与关系数据库的比较
5.4 NoSQL的四大类型
5.5 NoSQL的三大基石
5.6 从NoSQL到NewSQL数据库
5.7 本章小结
5.8 习题
实验4 NoSQL和关系数据库的操作比较
第6章 云数据库
6.1 云数据库概述
6.2 云数据库产品
6.3 云数据库系统架构
6.4 本章小结
6.5 习题
第三篇 大数据处理与分析
第7章 MapReduce
7.1 概述
7.2 MapReduce的工作流程
7.3 实例分析:WordCount
7.4 MapReduce的具体应用
7.5 MapReduce编程实践
7.6 本章小结
7.7 习题
实验5 MapReduce初级编程实践
第8章 Hadoop再探讨
8.1 Hadoop的优化与发展
8.2 HDFS 2.0的新特性
8.3 新一代资源管理调度框架YARN
8.4 Hadoop生态系统中具有代表性的功能组件
8.5 本章小结
8.6 习题
第9章 数据仓库Hive
9.1 概述
9.2 Hive系统架构
9.3 Hive工作原理
9.4 Hive HA基本原理
9.5 Impala
9.6 Hive编程实践
9.7 本章小结
9.8 习题
实验6 熟悉Hive的基本操作
第10章 Spark
10.1 概述
10.2 Spark生态系统
10.3 Spark运行架构
10.4 Spark的部署和应用方式
10.5 Spark编程实践
10.6 本章小结
10.7 习题
实验7 Spark初级编程实践
第11章 流计算
11.1 流计算概述
11.2 流计算的处理流程