更新时间:2021-09-17 18:14:07
封面
版权信息
作者简介
前言
第1章 大数据技术概述
1.1 什么是大数据
1.2 大数据平台架构
1.3 大数据工程师的技能树
1.4 大数据项目需求分析与设计
1.5 本章小结
第2章 搭建IDEA开发环境及Linux虚拟机
2.1 搭建IDEA开发环境
2.2 搭建Linux虚拟机
2.3 本章小结
第3章 基于Hadoop构建大数据平台
3.1 Zookeeper分布式协调服务
3.2 HDFS分布式文件系统
3.3 YARN资源管理系统
3.4 Hadoop分布式集群的构建
3.5 MapReduce分布式计算框架
3.6 本章小结
第4章 基于HBase和Kafka构建海量数据存储与交换系统
4.1 构建HBase分布式实时数据库
4.2 搭建Kafka分布式消息系统
4.3 本章小结
第5章 用户行为离线分析——构建日志采集和分析平台
5.1 搭建Flume日志采集系统
5.2 使用Flume采集用户行为数据
5.3 基于Hive的离线大数据分析
5.4 基于Hive的用户行为数据离线分析
5.5 本章小结
第6章 基于Spark的用户行为实时分析
6.1 Spark快速入门
6.2 Spark Core的核心功能
6.3 Spark分布式集群的构建
6.4 基于Spark Streaming的新闻项目实时分析
6.5 基于Spark SQL的新闻项目离线分析
6.6 基于Spark Structured Streaming的新闻项目实时分析
6.7 本章小结
第7章 基于Flink的用户行为实时分析
7.1 Flink快速入门
7.2 Flink分布式集群的构建
7.3 基于Flink DataStream的新闻项目实时分析
7.4 基于Flink DataSet的新闻项目离线分析
7.5 本章小结
第8章 用户行为数据可视化
8.1 构建Java Web系统查询用户行为
8.2 用户行为数据展示与分析
8.3 本章小结
内容简介