大数据基础与应用
上QQ阅读APP看书,第一时间看更新

3.6 本章小结

HDFS是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。它所具有的高容错、高可靠性、高可扩展性、高获得性、高吞吐率等特征为海量数据提供了不担心故障的存储,为超大数据集(Large Data Set)的应用处理带来了很多便利。