上QQ阅读APP看书,第一时间看更新
1.2.3 语义分割
1. 语义分割的定义
语义分割是将标签或类别与图像的每个像素关联的一种深度学习算法,用来识别构成可区分类别的像素集合。例如,自动驾驶汽车需要识别车辆、行人、交通信号、人行道和其他道路特征等。
语义分割的一个简单例子就是将图像划分成两类。如图1-27所示,一副图像显示一个人在海边,与之相配的版本显示分割为两个不同类别的图像像素:人和背景。
图1-27 语义分割
语义分割并不局限于两个类别,可以更改对图像内容进行分类的类别数。例如,图1-27中的图像也可分割为四个类别:人、天空、水和背景。
2. 语义分割与目标检测的区别
语义分割可以作为对象检测的一种有用替代方法,因为它允许感兴趣对象在像素级别上跨越图像中的多个区域。这种技术可以清楚地检测到形态不规则的对象。相比之下,目标检测要求目标必须位于有边界的方框内,如图1-28所示。
图1-28 自动驾驶的车辆检测
3. 语义分割在自动驾驶中的应用
因为语义分割会给图像中的像素加上标签,所以精确性高于其他形式的目标检测。这使得语义分割适用于各种需要准确图像映射的行业应用,比如自动驾驶,通过区分道路、行人、人行道、电线杆和其他汽车等,让汽车识别可行驶的路径。图1-29所示为自动驾驶场景的语义分割。
图1-29 自动驾驶场景的语义分割
图1-30所示为激光雷达点云的语义分割。
图1-30 激光雷达点云的语义分割