上QQ阅读APP看书,第一时间看更新
涵盖的内容
多年来,本书作者始终奋战在工业和学术领域的海量数据处理前线,面对的诉求都是更快地得到答案、使用可扩展的架构。我们将竭力传授来之不易的经验,使你少走弯路。
每章开头都列出了该章将要回答的问题(如果没有,请告诉我们,以便下次修订时改正)。
本书涵盖如下主题。
● 计算机原理:旨在让你知道幕后发生的情况。
● 列表和元组:这两个基本数据结构在语义和速度方面的细微差别。
● 字典和集合:这两个重要数据结构的内存分配策略和访问算法。
● 迭代器:如何使用迭代以更符合Python风格的方式编写代码并打开通往无穷数据流的大门。
● 纯Python方法:如何卓有成效地使用Python及其模块。
● NumPy:如何随心所欲地使用深受大家喜爱的NumPy库。
● 编译和即时计算:通过将代码编译成机器代码提高处理速度,并根据剖析结果行事。
● 并发性:高效地移动数据。
● multiprocessing:使用内置库multiprocessing执行并行计算和高效地共享NumPy库的各种方法,以及进程间通信(InterProcess Communication,IPC)的代价和好处。
● 集群计算:对研究系统和生产系统中的多进程(multiprocessing)代码进行转换,使其能够在本地或远程集群中运行。
● 减少内存占用量:在不购买大型计算机的情况下,解决数据规模庞大的问题。
● 实战经验教训:以实战故事的方式介绍经验教训,以免你重蹈覆辙。