上QQ阅读APP看书,第一时间看更新
第1章 开始数据挖掘之旅
我们今天的数据采集规模在人类历史上是空前的,日常生活也越来越依赖我们所采集的这些信息。我们希望计算机能把网页翻译成其他语言,预报天气,推荐我们喜欢的书,诊断我们的健康问题。类似的需求还会继续增长,我们会需要更多的应用和更高的精确性。数据挖掘技术可以用来训练计算机,使其根据已有数据做出决策。如今,数据挖掘技术已成为支撑很多高科技系统的骨干。
Python的迅速普及并非偶然。它的灵活度高;模块众多,可以执行很多任务;比起其他任何编程语言,Python代码通常更为简洁,可读性更强。Python在数据挖掘领域已经形成了一个由研究员、从业者和新手组成的氛围活跃的大社区。
本章将介绍如何使用Python进行数据挖掘,主要会涉及以下几个主题。
❑ 数据挖掘简介及其应用场景
❑ 搭建Python数据挖掘环境
❑ 亲和性分析示例:根据购买习惯推荐商品
❑(经典)分类问题示例:根据测量结果推测植物的种类