前言
人类感知外界信息,80%以上都是通过视觉得到的。然而,目前计算机还不能像人类一样拥有高效、灵活的视觉系统,但这种愿望正在逐步实现。模拟人类视觉系统的学科被称为计算机视觉。计算机视觉的目的是使计算机通过输入的二维图像,感知外部三维世界中物体的形状、位置、姿态、颜色、运动等信息。
目前,计算机视觉领域的理论框架是由David Marr于20世纪80年代提出的。David Marr认为,从二维图像恢复客观世界三维物体可见表面的几何结构是计算机视觉研究的主要目标之一。香港科技大学权龙教授认为,计算机视觉的核心研究方向是三维重建。目前,三维重建已广泛应用于自动驾驶、虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)、视觉测量、裂痕检测、古建筑保护等领域。在计算机视觉领域,三维重建通常需要摄像机标定、对应点匹配和三维结构计算3个步骤,其中摄像机标定和对应点匹配是三维重建中的两个关键问题。本书作者近年来一直致力于三维重建的研究工作,并参与多个国家自然科学基金项目,在摄像机标定、特征检测及匹配方面进行了深入的研究,并取得了一些成果。本书撰写的内容主要包括该领域的知识和研究成果,以及三维重建在视觉测量方面的应用。
全书共9章。第1章主要介绍视觉测量方法的研究现状、视觉测量过程及关键步骤。第2章主要介绍视觉测量中摄像机模型的基本知识,主要有理想状态下的成像模型和畸变状态下的摄像机模型及常用的摄像机标定方法。第3章针对在视觉测量过程中难以确定摄像机参数的问题,以单幅图像为对象,介绍一种基于单幅图像的摄像机畸变参数估计方法,并在畸变参数确定的基础上,分析基于P3P问题的摄像机外参数标定多解问题。第4章对影响测量精度的多种摄像机模型因素及综合参数效应进行分析,并给出相关结论。第5章介绍常用的底层特征检测及描述方法。第6章介绍视觉测量中的一种基于粗糙集的中层特征提取方法。第7章针对在视觉测量过程中的图像纹理单一而导致的特征不易检测的问题,提出图像直线特征提取过程中的Hough变换最小化参数空间分析方法。第8章针对视觉测量过程中的特征检测定位精度低的问题,研究一种基于四边形的基元提取方法与匹配方法。第9章介绍一款机械装备视觉测量原型系统。
本书由胡立华撰写,该项目受国家自然科学基金面上项目(61873264)、国家自然科学基金项目(U17311269)、山西省重点研发计划(201803D121059)资助。在编写过程中得到了太原科技大学计算机科学与技术学院及中国科学院自动化研究所各位老师的大力支持和协助,在此表示由衷的感谢!
由于时间仓促,编者水平有限,疏漏与不妥之处在所难免,敬请广大读者批评指正,欢迎提出宝贵意见,邮箱:sxtyhlh@126.com。
太原科技大学计算机科学与技术学院
胡立华
2019年11月