上QQ阅读APP看书,第一时间看更新
第一篇 Hadoop技术
第1章 大数据与Hadoop概述
大数据是一种数据规模大到在获取、存储、管理、分析等方面大大超出传统关系型数据库软件工具能力范围的数据集合,处理时需要采用新的分布式处理技术,而Hadoop就是大数据技术的标准,能够高效、可靠、低成本地处理海量数据。
本章涉及的主要知识点如下。
(1)大数据概述:大数据的定义、大数据行业发展、大数据的典型应用,让读者对大数据有一个宏观的了解。
(2)Hadoop概述:Hadoop简介、Hadoop生态子项目、Hadoop 3.X的新特性,这一节的内容在后面章节将逐步进行深入讲解。