更新时间:2022-07-29 14:42:15
封面
版权页
内容简介
作者简介
序言 大数据时代数据量暴涨带来的问题
1.数据存储成本的上升
2.数据访问的性能与成本没有成比例上升
3.数据安全问题
前言
创作背景
致谢那些帮助过我的人和组织
联系作者/联系书友
第1章 概述
1.1 大数据简介
1.1.1 大数据定义和维度
1.1.2 大数据管理挑战
1.2 高效能存储管理
1.2.1 存储虚拟化
1.2.2 自动分层存储
1.2.3 自动精简配置
1.2.4 数据缩减技术
1.3 本章小结
参考文献
第2章 存储技术基础
2.1 存储介质
2.1.1 磁存储介质
2.1.2 光存储介质
2.1.3 电子存储介质
2.2 存储接口
2.2.1 IDE接口
2.2.2 SATA接口
2.2.3 SCSI接口
2.2.4 SAS接口
2.2.5 PCIE接口
2.2.6 FC接口
2.3 存储系统架构
2.3.1 存储器分层结构
2.3.2 RAID技术
2.4 网络存储系统
2.4.1 直接连接存储
2.4.2 网络附加存储
2.4.3 存储区域网络
2.4.4 基于对象存储
2.4.5 几种存储结构的比较
2.5 本章小结
第3章 大数据管理技术
3.1 分布式计算框架
3.2 分布式文件系统
3.2.1 HDFS
3.2.2 Ceph
3.2.3 Lustre
3.3 NoSQL数据库
3.3.1 HBase
3.3.2 MongoDB
3.4 大数据仓库
3.4.1 Hive
3.4.2 Pig
3.4.3 Phoenix
3.5 本章小结
第4章 重复数据删除存储系统
4.1 重复数据删除的概念及分类
4.1.1 基本概念
4.1.2 技术分类
4.2 重复数据删除存储原理
4.2.1 系统架构
4.2.2 主要步骤
4.2.3 衡量指标
4.3 重复数据删除技术应用场景
4.3.1 数据备份
4.3.2 归档存储
4.3.3 远程容灾
4.3.4 虚拟化环境
4.3.5 主存储系统
4.3.6 新型存储介质
4.4 相关产品及开源项目
4.4.1 企业产品
4.4.2 开源项目
4.5 本章小结
第5章 重复数据删除关键技术
5.1 数据划分方法
5.1.1 全文件分块
5.1.2 静态分块
5.1.3 基于内容分块
5.1.4 基于应用分块
5.1.5 Delta编码
5.2 块索引查询优化技术
5.2.1 基于块局部性的优化策略
5.2.2 基于分层消重的优化策略
5.2.3 基于固态存储的优化策略
5.3 可扩展数据路由技术
5.3.1 基于分布式哈希表的块级数据路由技术
5.3.2 基于状态信息的超块级数据路由技术
5.3.3 基于相似性的文件级数据路由技术
5.4 块指纹计算加速方法
5.4.1 多核CPU加速方法
5.4.2 GPGPU加速方法
5.5 数据还原方法