2.2 计算机视觉的发展
计算机视觉领域的突出特点是多样性与不完善性。图2-1列出了计算机视觉与其他领域的关联。
图2-1 计算机视觉与其他领域的关联
20世纪70年代后期,人们已开始掌握部分解决具体计算机视觉任务的方法,可惜这些方法通常都仅适用于一群“狭隘”的目标(如脸孔、指纹、文字等),因而无法广泛地应用于不同场合。
对这些方法的应用通常作为某些解决复杂问题的大规模系统的一个组成部分(如医学图像的处理,工业制造中的质量控制与测量)。在计算机视觉的大多数实际应用当中,计算机被预设为用于解决特定的任务,然而基于机器学习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的计算机视觉应用或许可以成真。
人工智能研究的一个主要问题是如何让系统具备“计划”和“决策能力”,从而使之完成特定的技术动作(如移动一个机器人通过某种特定环境)。这一问题便与计算机视觉问题息息相关。在这里,计算机视觉系统作为一个感知器,为决策提供信息。另外一些研究方向包括模式识别和机器学习(这也隶属于人工智能领域,但与计算机视觉有着重要的联系),也由此,计算机视觉时常被看作人工智能与计算机科学的一个分支。
物理学是与计算机视觉有着重要联系的另一领域。
计算机视觉关注的目标在于充分理解电磁波(主要是可见光与红外线部分)遇到物体表面被反射所形成的图像,而这一过程便是基于光学物理和固态物理的,一些尖端的图像感知系统甚至会应用量子力学理论来解析影像表示的真实世界。同时,物理学中的很多测量难题也可以通过计算机视觉得到解决。也由此,计算机视觉同样可以被看作物理学的拓展。
另一个具有重要意义的领域是神经生物学,特别是其中的生物视觉系统部分。
20世纪中期,人类对各种动物的眼睛、神经元,以及与视觉刺激相关的脑部组织都进行了广泛的研究,这些研究得出了一些有关“天然的”视觉系统如何运作的描述,这也形成了计算机视觉中的一个子领域——人工系统,使之在不同的复杂程度下模拟生物的视觉运作。同时,在计算机视觉领域中,一些基于机器学习的方法也参考了部分生物机制。
计算机视觉的另一个相关领域是信号处理。很多有关单元变量信号的处理方法,特别是对时变信号的处理,都可以很自然地被扩展为计算机视觉中对二元变量信号或多元变量信号的处理方法。这类处理方法的一个主要特征便是它们的非线性及图像信息的多维性,在信号处理学中形成了一个特殊的研究方向。
除了上面提到的领域,很多研究课题同样可被看作纯粹的数学问题。例如,计算机视觉中的很多问题,其理论基础便是统计学、最优化理论及几何学。