第1章
绪论

视觉是人类感知外界信息的主要途径。人类对外界信息的感知，80%以上都是通过视觉获得的。随着计算机和信号处理技术的发展，人们开始用摄像机获取外界环境信息并将其转化为数字信号，然后用计算机进行处理。模拟人类的视觉系统的学科被称为计算机视觉。计算机视觉的研究目标是使计算机通过摄像机采集的二维图像，不仅能认知三维客观世界物体的形状、位置、姿态、颜色及运动等信息，而且能对客观世界的物体进行描述、存储、识别和理解。计算机视觉[1]作为一门综合性交叉学科，已经引起许多科学研究者的广泛兴趣，成为科学领域中一个富有挑战性的研究领域。

计算机视觉成为一门热门学科，得益于美国麻省理工学院的David Marr[2]提出的一个较为完善的视觉系统框架。他认为，计算机视觉的信息处理是一个复杂的过程，不同的信息有不同的处理过程，其最终的目的是实现计算机对外部世界的描述。Marr提出了3个层次，即计算机理论层次、外部客观世界的表达和算法层次、硬件实现层次。Marr认为，计算机视觉输入的是客观世界的二维图像，输出的是客观世界重建出来的三维物体的位置和形状。目前，研究者在Marr的计算机视觉系统框架下，进行了大量的研究，将相应理论广泛应用于物体识别、图像分割、三维重建等领域。

三维重建指从二维图像恢复客观对象的三维结构，通常包括摄像机标定、特征点匹配和三维结构计算3个关键步骤。基于计算机视觉的三维重建可应用于视觉测量、裂痕检测、古建筑保护、虚拟现实、可视通信等方面。

第1章 绪论

第1章
绪论