大数据Hadoop 3.X分布式处理实战
上QQ阅读APP看书,第一时间看更新

前言

随着云时代的来临,移动互联网、电子商务、物联网以及社交媒体快速发展,全球的数据正在以几何速度呈爆炸性增长,大数据也吸引了越来越多的人关注。大数据的核心技术就是Hadoop。目前市面上关于Hadoop的书有很多,但基本是关于Hadoop 1.X或Hadoop 2.X的,而且偏重理论讲述,缺少实践案例。本书从Hadoop 3.X实例出发,通过“理论+实践+视频”的方式,帮助读者轻松掌握大数据技术。特别值得一提的是,本书讲解了日志分析、推荐系统、垃圾消息识别3个企业级的综合大数据项目案例,读者稍加改造,即可在生产环境中使用,具有重大的实用价值,也可供在校大学生或研究生毕业设计时参考。

本书有何特色

1. 版本较新

技术研究需要具有一定的前瞻性,本书采用Hadoop 3.X,版本较新。目前国内关于Hadoop的图书基本是关于Hadoop 1.X或Hadoop 2.X的。

2. 知识全面

本书包括Hadoop及其生态组件伪分布式安装和完全分布式安装、分布式文件系统HDFS、分布式计算框架MapReduce、NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark等主要大数据技术。

3. 重视实战

针对每一个知识点,在基本理论讲述后都提供了实战项目,真正做到学以致用。读者通过实战项目,可以更容易地掌握大数据技术在具体工作中的应用。

4. 视频讲解

本书作者具有丰富的IT培训和视频录制经验,针对每章内容精心录制了多个讲解视频。全书有32个相关视频,视频总时长超过12小时,特别是环境搭建、项目运行、源码分析等场景,通过视频学习将更加轻松。

5. 图文并茂

一图胜过千言万语,全书共有超过200幅插图,用于展示语言难以描述的内容,同时插图也有助于增加阅读的趣味性。

6. 在线答疑

本书提供答疑QQ群,在线答疑,群号是243363382。也可以通过作者的QQ号进行在线交流,作者的QQ号是107964558。

7. 电子资源

本书在附带的电子资源中,提供了每章的相关视频、源代码及测试数据,用Eclipse工具打开源代码即可运行。通过运行效果来分析源代码,理解会更容易、更深刻。

读者可扫描“职场研究社”二维码,关注后回复“52466”即可获取电子资源下载链接,也可以扫描云课二维码,手机端在线观看视频。

职场研究社

云课

适合阅读本书的读者

(1)渴望转型进入大数据领域的程序员。

(2)希望学习大数据技术的在校大学生或研究生。

(3)希望提升技能的初级大数据领域从业人员。

(4)希望研究“推荐系统”等大数据典型应用的大数据开发工程师。