更新时间:2024-04-25 18:59:38
封面
版权信息
内容简介
前言
第1章 初识Flink
1.1 Flink定位
1.2 Flink的核心特性
1.3 Flink的API
1.4 与Flink搭配使用的引擎
1.5 本章小结
第2章 Flink WordCount作业开发及运行
2.1 基础环境准备
2.2 创建一个Flink项目
2.3 Flink WordCount代码案例
2.4 Flink作业的骨架结构
2.5 本章小结
第3章 Flink分布式架构及核心概念
3.1 分布式应用与非分布式应用的异同
3.2 Flink作业的运行时架构
3.3 Flink作业的3种部署模式
3.4 Flink作业的2种资源提供框架
3.5 开发Flink作业时涉及的核心概念
3.6 Flink Web UI
3.7 本章小结
第4章 Flink DataStream API
4.1 什么是DataStream
4.2 执行环境
4.3 数据源
4.4 数据简单转换
4.5 数据分组与聚合
4.6 数据汇
4.7 算子间数据传输的8种策略
4.8 数据异步I/O处理
4.9 RichFunction
4.10 数据序列化
4.11 工具类及Debug建议
4.12 本章小结
第5章 Flink的时间语义和时间窗口
5.1 时间语义和时间窗口概述
5.2 时间窗口
5.3 时间语义
5.4 Watermark
5.5 双流数据时间窗口关联
5.6 计数窗口
5.7 生产中的常见问题及解决方案
5.8 本章小结
第6章 Flink状态原理及异常容错机制
6.1 Flink有状态计算
6.2 Flink状态接口
6.3 Flink状态管理
6.4 Flink状态后端
6.5 Flink故障重启策略
6.6 本章小结
第7章 Flink有状态流处理API
7.1 ProcessFunction
7.2 5种不同应用场景下的处理函数
7.3 KeyedProcessFunction
7.4 本章小结
第8章 Flink Table API和SQL API
8.1 直接上手Table API和SQL API
8.2 Table API和SQL API的核心API及功能
8.3 使用SQL实现流处理的核心技术
8.4 本章小结
第9章 Flink SQL API语法
9.1 SQL数据类型
9.2 CREATE TABLE
9.3 WITH
9.4 SELECT和WHERE
9.5 SELECT DISTINCT
9.6 时间窗口聚合
9.7 GROUP BY分组聚合
9.8 流关联
9.9 维表关联
9.10 TopN排序
9.11 Deduplication去重
9.12 窗口TopN
9.13 Over聚合
9.14 其他操作
9.15 EXPLAIN
9.16 SQL Hints
9.17 本章小结
第10章 Flink SQL API函数
10.1 函数的使用案例
10.2 函数的分类
10.3 开发用户自定义函数
10.4 本章小结
第11章 Flink SQL API参数配置及性能调优
11.1 参数配置
11.2 性能调优
11.3 本章小结
作者简介
封底