上QQ阅读APP看书,第一时间看更新
第1章 双阶段检测
1.1.1 R-CNN检测流程
R-CNN检测流程(见图1.2)可分成5个步骤:
(1)使用选择性搜索[9]在输入图像上提取候选区域;
[9] 参见Jasper Uijlings、Koen E. A. van de Sande、Theo Gevers等人的论文“Selective Search for Object Recognition”。
(2)使用CNN在每个缩放到固定大小(227×227)的候选区域上提取特征;
(3)将CNN提取到的Pool5层的特征输入N(类别数量)个SVM分类器对物体类别进行打分;
(4)将Pool5层的特征输入岭回归位置精校器进行位置精校;
(5)使用贪心的非极大值抑制(non-maximum suppression,NMS)合并候选区域,得到输出结果。
图1.2 R-CNN检测流程
由上文可见,R-CNN的训练过程涉及CNN特征提取器、SVM分类器和岭回归位置精校器共3个模块[10]。
[10] 论文中给出的图(图1.2)没有画出回归器部分。