1.4 本书结构框架和内容概况
本书主要介绍计算机视觉中的3D部分,对应图像工程中高层的基本概念、基础理论和实用技术。通过综合使用这些理论和技术可构建各种计算机视觉系统,探索实际应用问题的解决方法。另外,通过对图像工程高层次内容的介绍,还可帮助读者在利用通过图像工程低层和中层技术得到的结果的基础上获得更多信息,将各层次的技术结合起来,融会贯通。
1.4.1 结构框架和主要内容
根据图1-8,本书的结构框架和主要内容如图1-10所示。
注:括号内数字对应具体章号。
图1-10 本书结构框架和主要内容
1.4.2 各章概况
本书主要内容共有12章和1个附录。
第1章介绍人类视觉的基本概念和知识。先讨论了视觉的一些重要特点和特性,接着结合视感觉对视知觉进行了介绍。在此基础上,引入了计算机视觉的概况讨论和本书主要内容。
第2章讨论摄像机标定方案,分别讨论了基本的线性摄像机模型和典型的非线性摄像机模型,还介绍了一种传统的摄像机标定方法和一种简单的基于主动视觉的标定方法。
第3章介绍3D图像采集,特别是深度图的采集。其中,既介绍了直接采集深度图的方法,也介绍了参考人类视觉的双摄像机立体成像方法。
第4章介绍的视频图像是另一种形式的3D图像(2D空间加1D时间),其中含有运动信息。该章分析了视频图像的特点,讨论了运动信息分类、检测和滤波的原理及方法。
第5章讨论视频中运动目标的检测和跟踪技术,从简到繁包括逐像素差分、背景建模、光流估计,以及几种典型的运动目标跟踪方法。
第6章介绍双目立体视觉,包括立体视觉各模块的功能、基于区域的双目立体匹配和基于特征的双目立体匹配技术,以及一种视差图误差检测与校正方法。
第7章介绍利用单目多幅图像进行物体恢复的两类方法:基于光度立体学的方法和基于光流场从运动中求取物体结构的方法。
第8章介绍利用单目单幅图像进行物体恢复的两类方法:由物体表面影调变化恢复物体形状的方法和由物体表面纹理变化恢复表面朝向的方法。
第9章介绍对实际3D目标进行表达的典型方法,包括3D表面表达方法、等值面的构造和表达方法,以及对2D并行轮廓进行插值以获取3D表面的方法和直接对3D实体进行表达的方法。
第10章介绍不同层次的匹配技术,包括比较具体的目标匹配和动态模式匹配方法,以及比较抽象的利用图同构进行关系匹配的方法和借助线条图标记实现物体模型匹配的方法。
第11章结合场景知识和学习推理介绍场景解释的问题,包括逻辑系统和模糊推理,还讨论了两种在场景分类中广泛使用的模型:词袋/特征包模型和概率隐语义分析模型(pLSA模型)。
第12章介绍对时空行为的理解,包括对时空技术和时空兴趣点的介绍,并介绍了对动态轨迹进行学习和分析的方法及对动作进行分类和识别的方法。
附录A介绍视知觉,比较详细地介绍了形状知觉、空间知觉和运动知觉的特点、规律等。
在各章和附录后均有“各节要点和进一步参考”,一方面归纳各节的中心内容,另一方面介绍可深入学习的参考文献。除附录外,各章均附有自我检测题(含提示和答案)。