更新时间:2020-03-16 14:00:33
封面
版权信息
前言
第1章 实时流计算
1.1 大数据时代的新挑战:实时流计算
1.2 实时流计算使用场景
1.3 实时流数据的特点
1.4 实时流计算系统架构
1.5 本章小结
第2章 数据采集
2.1 设计数据采集的接口
2.2 使用Sprin Boot实现数据采集服务器
2.3 BIO与NIO
2.4 NIO和异步
2.5 使用Netty实现数据采集服务器
2.6 本章小结
第3章 实现单节点流计算应用
3.1 自己动手写实时流计算框架
3.2 CompletableFuture方法与原理
3.3 采用CompletableFuture实现单节点流处理
3.4 流计算应用的性能调优
3.5 本章小结
第4章 数据处理
4.1 流计算到底在计算什么
4.2 流数据操作
4.3 时间维度聚合特征计算
4.4 关联图谱特征计算
4.5 事件序列分析
4.6 模型学习和预测
4.7 本章小结
第5章 实时流计算的状态管理
5.1 流的状态
5.2 采用Redis实现流信息状态管理
5.3 采用Apache Ignite实现流信息状态管理
5.4 扩展为集群
5.5 本章小结
第6章 开源流计算框架
6.1 Apache Storm
6.2 Spark Streaming
6.3 Apache Samza
6.4 Apache Flink
6.5 本章小结
第7章 当做不到实时
7.1 做不到实时的原因
7.2 Lambda架构
7.3 Kappa架构与架构实例
7.4 本章小结
第8章 数据传输
8.1 消息中间件
8.2 Apache Kafka
8.3 RabbitMQ
8.4 Apache Camel
8.5 本章小结
第9章 数据存储
9.1 存储的设计原则
9.2 点查询
9.3 Ad-Hoc查询
9.4 离线分析
9.5 关系型数据库查询
9.6 本章小结
第10章 服务治理和配置管理
10.1 服务治理
10.2 面向配置编程
10.3 动态配置
10.4 将前端配置与后端服务配置隔离开
10.5 本章小结
第11章 实时流计算应用案例
11.1 实时流数据特征提取引擎
11.2 使用Flink实现风控引擎
11.3 本章小结