更新时间:2020-04-14 15:01:09
封面
版权信息
内容提要
前言
第一篇 Hadoop技术
第1章 大数据与Hadoop概述
1.1 大数据概述
1.2 Hadoop概述
1.3 小结
1.4 配套视频
第2章 Hadoop伪分布式安装
2.1 Hadoop伪分布式安装前的准备
2.2 Hadoop伪分布式安装
2.3 Hadoop验证
2.4 小结
2.5 配套视频
第3章 Hadoop分布式文件系统——HDFS
3.1 HDFS原理
3.2 HDFS Shell
3.3 HDFS Java API
3.4 小结
3.5 配套视频
第4章 分布式计算框架MapReduce
4.1 MapReduce原理
4.2 MapReduce编程基础
4.3 MapReduce综合实例——数据去重
4.4 MapReduce综合实例——数据排序
4.5 MapReduce综合实例——求学生平均成绩
4.6 MapReduce综合实例——WordCount高级示例
4.7 小结
4.8 配套视频
第二篇 Hadoop生态系统的主要大数据工具整合应用
第5章 NoSQL数据库HBase
5.1 HBase原理
5.2 HBase伪分布式安装
5.3 HBase Shell
5.4 小结
5.5 配套视频
第6章 HBase高级特性
6.1 HBase Java API
6.2 HBase与MapReduce的整合
6.3 小结
6.4 配套视频
第7章 分布式数据仓库Hive
7.1 Hive概述
7.2 Hive伪分布式安装
7.3 Hive QL的基础功能
7.4 Hive QL的高级功能
7.5 小结
7.6 配套视频
第8章 Hive高级特性
8.1 Beeline
8.2 Hive JDBC
8.3 Hive函数
8.4 Hive表的高级特性
8.5 小结
8.6 配套视频
第9章 数据转换工具Sqoop
9.1 Sqoop概述与安装
9.2 Sqoop导入数据
9.3 Sqoop导出数据
9.4 深入理解Sqoop的导入与导出
9.5 小结
9.6 配套视频
第10章 内存计算框架Spark
10.1 Spark入门
10.2 Spark Streaming
10.3 Spark SQL
10.4 小结
10.5 配套视频
第11章 Hadoop及其常用组件集群安装
11.1 Hadoop集群安装
11.2 HBase集群安装
11.3 Hive集群安装
11.4 Spark集群安装
11.5 小结
11.6 配套视频
第三篇 实战篇
第12章 海量Web日志分析系统
12.1 案例介绍
12.2 案例分析
12.3 案例实现
12.4 小结
12.5 配套视频
第13章 电商商品推荐系统
13.1 案例介绍
13.2 案例设计
13.3 案例实现
13.4 小结
13.5 配套视频
第14章 分布式垃圾消息识别系统
14.1 案例介绍
14.2 RPC远程方法调用的设计
14.3 数据分析设计
14.4 案例实现
14.5 小结
14.6 配套视频