上QQ阅读APP看书,第一时间看更新
1.2.1 什么是机器学习
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
机器学习是一类算法的总称,这些算法试图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类。更具体地说,机器学习可以看作是寻找一个函数,输入的是样本数据,输出的是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(Generalization)能力。
机器学习有一个显著的特点,也是机器学习最基本的做法之一,就是使用一个算法从大量的数据中解析并得到有用的信息,并从中学习,然后对真实世界中将会发生的事情进行预测并作出判断。机器学习需要海量的数据进行训练,并从这些数据中得到有用的信息,然后反馈到真实世界的用户中。
可以用一个简单的例子来说明机器学习。例如在网上购物的时候,网站会向消费者推送商品信息,这些推荐的商品往往是消费者感兴趣的东西,这个过程就是通过机器学习完成的。其实这些推送的商品是网站根据消费者以前的购物订单和经常浏览的商品记录而得出的结论,可以从中得出哪些商品是消费者感兴趣的,并且大概率会购买的,然后将这些商品定向推送给消费者。