3.1 机器学习基本分类
首先对于不同的学习目的和计算要求,机器学习在实践中按不同目的有着不同分类,其中包括基于学科的分类、基于学习模式的分类以及基于应用领域的分类。
3.1.1 应用学科的分类
一般而言,机器学习在实际使用过程中主要应用和使用若干种学科的知识,吸收兼并不同的思想和理念,从而使得机器学习最终的正确率得到提高,但是根据算法的不同,学习过程和方式也不尽相同。机器学习在实际中所使用的学科方法主要分成以下几类:
- 统计学:基于统计学的学习方法是收集、分析、统计数据的有效工具,描述数据的集中和离散情况,模型化数据资料。
- 人工智能:是一种积极的学习方法,利用现成的数据对问题进行计算,从而提高机器本身计算和解决问题的能力。
- 信息论:信息的度量和熵的度量,对其中信息的设计和掌握。
- 控制理论:理解对象相互之间的联系与通信,关注于总体上的性质。
因此可以说,机器学习的过程就是不同的学科之间相互支撑、相互印证、共同作用的结果。而机器学习的进步又直接扩展了相关学科中人工智能的研究,取得了丰硕的成果,并且使得机器学习在原有基础上产生了更深层次的飞跃。
3.1.2 学习模式的分类
学习模式是指机器学习在过程训练中所使用的策略模式。一个好的学习模式一般是由两部分构成的,即数据和模型。数据提供基本的信息内容,而模型是机器学习的核心,通过机器学习能够将数据中蕴含的内容以能够被理解的形式保存下来。
一般来说,机器学习中学习模式的分类是根据数据中所包含的信息复杂度来分类,基本可以分成以下几类:
- 归纳学习:归纳学习是应用范围最广的一种机器学习方法,通过大量的实例数据和结果分析,使得机器能够归纳获得该数据的一种一般性模型,从而对更多的未知数据进行预测。
- 解释学习:根据已有的数据对一般的模型进行解释,从而获得一个较为泛型的学习模型。
- 反馈学习:通过学习已有的数据,根据不断地获取数据的反馈进行模型的更新,从而直接获取一个新的、可以对已有数据进行归纳总结的机器学习方法。
因此可以看到,机器学习在学习模式上的分类,实际上就是学习模型的分类。需要注意的是,在机器学习的运行过程中,模型往往跟数据的复杂度成正比,数据的复杂度越大,模型的复杂度就越大,计算就越为复杂。
而不同的数据所要求的模型也是千差万别的,因此机器学习中学习模式的分类实际是基于不同的数据集而采用的不同的应对策略,基于应对策略的不同而选择不同的模型,从而获得更好的分析结果。
3.1.3 应用领域的分类
机器学习的最终目的是为了解决现实中的各种问题。通过机器学习的不同应用领域,可以分成以下几类:
- 专家系统:通过数据的学习,使得学习机器获得拥有某个方面大量的经验和认识的能力,从而使之能够利用相关的知识来解决和处理问题。
- 数据挖掘:通过对既有知识和数据的学习,从而能够挖掘出隐藏在数据之中的行为模式和类型,从而获得对某一个特定类型的认识。
- 图像识别:通过学习已有的数据,从而获得对不同的图像或同一类型图像中特定目标的识别和认识。
- 人工智能:通过对已有模式的认识和学习,使得机器学习能够用于研究开发、模拟和扩展人的多重智能的理论、方法和技术。
- 自然语言处理:实现人与对象之间通过某种易于辨识的语言进行有效通信的一种理论和方法。
此外,基于机器学习的应用领域还包括对问题的规划和求解、故障的自动化分析诊断、经验的推理等。主要的分类如图3.1所示。
图3.1 机器学习的主要分类
因此,对于机器学习的各种分类来说,绝大部分都可以分成两类,即问题的模型建立和基于模型的问题求解。
问题的模型建立是指通过对数据和模式的输入,做出描述性分析,从而确定输入的内容的形式。而基于模型的求解是指对输入的数据在分析后找出相关的规律,并利用此规律提高解决问题的能力。