更新时间:2018-12-28 11:17:47
封面
版权信息
前言
第1章 概论
1.1 引子
1.2 大数据挑战
1.3 大数据的存储和管理
1.4 大数据的处理和分析
1.5 小结
参考文献
理论篇
第2章 数据一致性理论
2.1 CAP理论
2.2 数据一致性模型
2.3 ACID与BASE
2.4 数据一致性实现技术
2.5 小结
第3章 数据存储模型
3.1 总论
3.2 键值存储
3.3 列式存储
3.4 文档存储
3.5 图形存储
3.6 小结
第4章 数据分区与放置策略
4.1 分区的意义
4.2 范围分区
4.3 列表分区
4.4 哈希分区
4.5 三种分区的比较
4.6 放置策略
4.7 小结
第5章 海量数据处理方法
5.1 MapReduce简介
5.2 MapReduce数据流
5.3 MapReduce数据处理
5.4 Dryad简介
5.5 Dryad数据处理步骤
5.6 MapReduce vs Dryad
5.7 小结
第6章 数据复制与容错技术
6.1 海量数据复制的作用和代价
6.2 海量数据复制的策略
6.3 海量数据的故障发现与处理
6.4 小结
第7章 数据压缩技术
7.1 数据压缩原理
7.2 传统压缩技术[1]
7.3 海量数据带来的3V挑战
7.4 Oracle混合列压缩
7.5 Google数据压缩技术
7.6 Hadoop压缩技术
7.7 小结
第8章 缓存技术
8.1 分布式缓存简介
8.2 分布式缓存的内部机制
8.3 分布式缓存的拓扑结构
8.4 小结
系统篇
第9章 key-value数据库
9.1 key-value模型综述
9.2 Redis
9.3 Voldemort
9.4 小结
第10章 Column-Oriented数据库
10.1 Column-Oriented数据库简介
10.2 Bigtable数据库
10.3 Hypertable数据库
10.4 Cassandra数据库
10.5 小结
第11章 文档数据库
11.1 文档数据库简介
11.2 CouchDB数据库
11.3 MongoDB数据库
11.4 小结
第12章 图存数据库
12.1 图存数据库的由来及基本概念
12.2 Neo4j图存数据库
12.3 GraphDB
12.4 OrientDB
12.5 三种图存数据库的比较
12.6 小结
第13章 基于Hadoop的数据管理系统
13.1 Hadoop简介
13.2 HBase
13.3 Pig
13.4 Hive
13.5 小结