致谢
感谢在与我们讨论或阅读手稿后,为我们提供宝贵思路、反馈、意见、建议和鼓励的所有同事和其他人。虽然可能有所遗漏,但我们想在此一一感谢:Panos Adamopoulos、Manuel Arriaga、Josh Attenberg、Solon Barocas、Ron Bekkerman、Josh Blumenstock、Ohad Brazilay、Aaron Brick、Jessica Clark、Nitesh Chawla、Peter Devito、Vasant Dhar、Jan Ehmke、Theos Evgeniou、Justin Gapper、Tomer Geva、Daniel Gillick、Shawndra Hill、Nidhi Kathuria、Ronny Kohavi、Marios Kokkodis、Tom Lee、Philipp Marek、David Martens、Sophie Mohin、Lauren Moores、Alan Murray、Nick Nishimura、Balaji Padmanabhan、Jason Pan、Claudia Perlich、Gregory Piatetsky-Shapiro、Tom Phillips、Kevin Reilly、Maytal Saar-Tsechansky、Evan Sadler、Galit Shmueli、Roger Stein、Nick Street、Kiril Tsemekhman、Craig Vaughan、Chris Volinsky、Wally Wang、Geoff Webb、Debbie Yuster以及Rong Zheng。我们还想感谢Foster课上的同学们,这些课程包括商业分析的数据挖掘、实用数据科学、数据科学导论、数据科学研讨班。你们在使用本书早期手稿期间提出的相关问题,为本书的改进提供了重要参考。
感谢这些年来所有教过我们数据科学知识和数据科学教学方法的同事,尤其是Maytal Saar-Tsechansky和Claudia Perlich。Maytal曾在多年前慷慨地与Foster分享了她的数据挖掘课笔记。本书中的很多示例都基于她的思路和案例,比如第3章的分类树案例(尤其是“主体”可视化的部分),第4章中以可视化方式比较树模型和线性判别函数对实例空间的分割,第6章的“David会响应吗”案例,等等。Claudia过去几年曾经与Foster同期讲授过商业分析的数据挖掘以及数据科学导论课程,Foster也从Claudia那里受益良多。
感谢David Stillwell、Thore Graepel和Michael Kosinski为书中的一些案例提供Facebook上的点赞数据。感谢Nick Street为我们提供细胞核数据,并允许我们在第4章中使用细胞核图像。感谢David Martens在手机定位可视化方面提供的帮助。感谢Chris Volinsky提供他在Netflix挑战赛中作品的数据。感谢Sonny Tambe很早就为我们提供了他在大数据技术与生产力方面的成果。感谢Patrick Perry为我们提供了第12章使用的银行电话中心案例。感谢Geoff Webb允许我们使用Magnum Opus关联挖掘系统。
最重要的是要感谢我们的家人,感谢他们给予我们的耐心、鼓励和爱。
我们在撰写本书时,使用了大量的开源软件及其案例。因此,我们还需感谢以下软件和程序包的开发者和贡献者:
· Python和Perl
· SciPy、NumPy、Matplotlib和Scikit-Learn
· Weka
· 加利福尼亚大学欧文分校的机器学习仓库(Bache & Lichman, 2013)