前言
关于大数据的书籍通常会沦为以下两类:要么是对事物的实际运行方式不提供解释;要么是只适合研究生使用的高难度数学教科书。本书的写作目的与这两类都有所不同,可被视为第三类方案。它涉及的内容包括:大数据运作方式的基础知识;大数据如何改变我们周围的世界;它对我们的日常生活及商业世界的影响。
数据原本指文件和论文,也可能带有几张照片,但现代意义上数据的含义却远不止于此。社交网站每分钟都会以图像、视频和电影的形态生成大量数据。当我们输入地址和详细信用卡信息进行在线购物时也会创建数据。现在,我们正以几十年前无法想象的速度在收集和存储数据,但是,正如我们将在本书中看到的那样,新的数据分析技术正在将这些数据转换为有用的信息。在撰写本书时,我发现,如果不围绕大公司对大数据的收集、存储、分析和使用来进行写作,就无法在真正意义上讨论大数据。由于谷歌和亚马逊等公司在大数据领域的引领地位,因此我会不时提及它们。
本书的第一章首先向读者介绍了通常意义上的数据多样xv性,然后解释了数字时代如何改变我们定义数据的方式。通过讨论数据爆炸,顺便引入大数据的概念,其中涉及计算机科学、统计数据以及它们之间的接口。在第二章至第四章中,我使用了大量的图表来协助解释大数据所依赖的一些新方法。第二章探讨了大数据的特别所在,并借此提出了更具体的定义。在第三章中,我们讨论了与存储和管理大数据有关的问题。大多数人都熟谙在个人计算机上备份数据,然而,面对今时正在生成的海量数据,我们该如何应对?为了回答这个问题,我们将讨论数据库存储,以及在计算机集群之间分配任务的想法。第四章认为,大数据只有在我们可以从中提取有用信息时才有价值。通过简述几种公认的技术,我们可以了解如何将数据转换为有价值的信息。
然后,我们从第五章以大数据在医学中的作用开始,对大数据应用进行更详细的讨论。第六章通过亚马逊公司和奈飞公司(Netflix)的案例来分析商务实践,每个案例都彰显了使用大数据进行营销的不同特征。第七章探讨了围绕大数据的一些安全问题以及加密的重要性。数据盗窃已成为一个大问题,我们看到的是新闻中出现的一些案例,包括斯诺登和维基解密。本章最后说明了,网络犯罪是大数据不可回避的问题。在最后一章,即第八章中,我们会看到,通过先进的机器人及其在工作场所中的使用,大数据如何改变我们生活于其中的社会。本书结束于对未来智能家居和智能城市的思考。
本书只是简短的入门,不能论及大数据的所有内容,希望读xvi者能通过“进一步阅读”中的建议来继续自己感兴趣的探究。