上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第1章
绪论
视觉是人类感知外界信息的主要途径。人类对外界信息的感知,80%以上都是通过视觉获得的。随着计算机和信号处理技术的发展,人们开始用摄像机获取外界环境信息并将其转化为数字信号,然后用计算机进行处理。模拟人类的视觉系统的学科被称为计算机视觉。计算机视觉的研究目标是使计算机通过摄像机采集的二维图像,不仅能认知三维客观世界物体的形状、位置、姿态、颜色及运动等信息,而且能对客观世界的物体进行描述、存储、识别和理解。计算机视觉[1]作为一门综合性交叉学科,已经引起许多科学研究者的广泛兴趣,成为科学领域中一个富有挑战性的研究领域。
计算机视觉成为一门热门学科,得益于美国麻省理工学院的David Marr[2]提出的一个较为完善的视觉系统框架。他认为,计算机视觉的信息处理是一个复杂的过程,不同的信息有不同的处理过程,其最终的目的是实现计算机对外部世界的描述。Marr提出了3个层次,即计算机理论层次、外部客观世界的表达和算法层次、硬件实现层次。Marr认为,计算机视觉输入的是客观世界的二维图像,输出的是客观世界重建出来的三维物体的位置和形状。目前,研究者在Marr的计算机视觉系统框架下,进行了大量的研究,将相应理论广泛应用于物体识别、图像分割、三维重建等领域。
三维重建指从二维图像恢复客观对象的三维结构,通常包括摄像机标定、特征点匹配和三维结构计算3个关键步骤。基于计算机视觉的三维重建可应用于视觉测量、裂痕检测、古建筑保护、虚拟现实、可视通信等方面。