大数据技术和应用
上QQ阅读APP看书,第一时间看更新

关于本书

本书定位为大数据从入门到应用的简明系统教材,特色是理论和实践相结合,更多的是以应用实战为主,内容全面、深入浅出地讲解了每个知识点,通俗易懂。对每个实验基本是按照学习的习惯,分步骤式地讲述,每个步骤都有文字说明和效果截图,使得读者能很清晰地知晓自己在动手实操过程的效果和错误之处,一目了然。

本书使用Apache原生态的Hadoop环境,包括关系型数据库MySQL、分布式文件系统HDFS、非结构化数据库HBase、数据接入工具Kafka等组件。在撰写过程中,参考了大量网络的资料,百度、谷歌、知乎、CSDN等知名网站,阅读了多种大数据相关方面的文献,对比了各自介绍文章的优势和不足。

本书分为9章,第1章着重介绍大数据的基础应用和发展趋势;第2章着重介绍大数据开发所需的技术基础,包括Linux、Java、SQL等;第3章着重介绍常见的数据采集器以及采集工具Flume和传输工具Sqoop;第4章着重介绍大数据存储相关的HDFS和NoSQL、Redis、MongoDB、Neo4j等数据库;第5章着重介绍数据仓库Hive和大数据挖掘分析算法及应用;第6章着重介绍了Spark计算框架的原理机制和处理技术;第7章着重介绍了大数据可视化原理和Tebleau、Power BI等工具;第8章分析了大数据技术目前所面临的安全挑战及其对策;第9章对大数据技术的应用和发展做出了展望。全书提供了与章节学习内容配套的实验,重点章节配有习题。