AL123 人文社科会员免费专区文学 2025-08-19

深度学习及自动驾驶应用_徐国艳；王章宇；周帆编著_AZW3_MOBI_EPUB_PDF_电子书（无页码）_徐国艳；王章宇；周帆编著

内容节选

6.1图像分割概述 6.1.1 图像分割的分类根据任务和输入数据类型的不同，图像分割可以细化为以下三种具体任务：语义分割、实例分割、全景分割，如图6.1所示。其中，语义分割主要是对图像中每一个像素点进行类别预测；实例分割则是在目标检测的基础上融合了语义分割，在每个预测框中勾勒出对应的“实例”；全景分割则是融合了语义分割与实例分割，既要把所有目标都检测出来，又要区分同类别中的不同实例。图6.1 图像分割分类当输入的数据从静态图像变为视频时，图像分割又有了新的两类任务：视频目标分割和视频实例分割。视频目标分割往往是在视频片段中的每一帧都进行单个对象的检测与分割，后者则是对视频片段中的每一帧都进行多个对象的检测与分割。图像分割技术现已在多个领域中得到应用，如安防领域的人像分割、自动驾驶领域的车道检测、医学图像中的病理分析、工业领域的质检环节等。 6.1.2 图像分割方法的发展语义分割是图像分割方法的基础，实例分割、全景分割在某种程度上其实是语义分割与目标检测算法融合的应用。因此，本章接下来所说的图像分割与图像分割方法，若无特殊说明，均指语义分割和语义分割方法。图像分割算法与目标检测算法一样，存在着传统图像分割算法与基于深度学习的图像分割算法两大类，如图6.2所示。图6.2 图像分割算法的分类 1.传统图像分割算法传统图像分割方法简单有效，经常作为图像分割的预处理步骤，快速提取图像信息，提升图像分割任务的效率。传统的方法主要有：基于阈值的方法、基于边缘的方法、基于区域的方法、基于聚类的方法、基于图论的方法等。 1）基于阈值的图像分割方法，实质上是一种简单的统计方法。其根据图片的灰度统计直方图，将同一区间范围内的灰度值对应的像素认为是同一类。对于输入彩色的图片，既可以将其转化为单通道的灰度图，也可以对三个通道分别使用基于阈值方法的灰度值进行统计。基于阈值的方法对于画面内容单一、灰度分布均匀、对比度较高的图片效果较好，但对于复杂的图片、有噪声的图片效果较差，且对于阈值的设定提出了较高的要求。阈值的选择往往决定了算法最终的图像分割效果。 2）基于边缘的图像分割方法，就是筛选出图像中各个目标可能边界，筛选的依据是判断图像中某一像素点与相邻点像素值的差异。基于边缘的算法常常有两类：基于相似性准则的串行边缘检测；基于微分算子与卷积运算的并行边缘检测。其中，后者简单快捷、性能较好，目前是最常用的边缘检测算法。常见的边缘检测算子有Robert、Sobel、Prewitt等。 3）基于区域的图像分割方法，是一类利用图像空间信息与像素相似性特征构成区域的分割方法。常用的区域分割方法有区域生长法、分裂合并法。区域生长法首先选择一个种子区域作为生长起点，根据一定的生长规则（如颜色、纹理等）向附近具有类似特征的区域扩张，再将新的区域作为种子继续扩张，重复执行直到所有区域都不再生长为止。分裂合并法则首先将图像分成若干区域，再根据相似性准则进行分裂、合并，重复执行直到不再分裂合并为止。 4）基于聚类的图像分割方法，是将具有相似特征的像素点聚集到同一区域，重复执行聚类过程，最终将像素点聚集到几个不同的类别中，实现对图像的分割。随着图像分割任务越来越复杂，聚类分割技术也在不断地发展。2012年，Achanta等提出的简单线性迭代聚类（Simple Linear Iterative Clustering，SLIC）算法，通过像素点距离、颜色相似度，聚类生成“超像素”，进而实现图像分割。该方法还适用于位姿估计、目标跟踪与识别等场景，是图像处理的一种经典方法。 5）基于图论的图像分割方法，其基本思想是将分割问题转化为图的划分问题，通过对目标函数的最优化求解，得到最终的分割结果。以经典的Graph Cut算法为例，其将图论中的“最小割（min cut）”问题引入图像分割，将图像分为前景和背景，并转化为S-T无向图，通过分割操作来减小目标函数值。通过不断迭代找到使目标函数最小的分割操作，从而实现图像分割。除了介绍的以上几类算法，传统的图像分割算法还有许多基于特定理论的方法，如形态学、遗传算法、小波变换、模糊理论等。随着对分割任务要求的提高，图像分割方法也不断推陈出新。 2.基于深度学习的图像分割算法基于深度学习的图像分割算法有两类：一类是直接对图像进行卷积运算；另一类是对图像建立图表征后再进行图卷积运算。直接对图像进行卷积运算的代表算法有FCN、U-Net、Seg-Net、DeepLab系列等。2015年，Long J.等人首次将深度学习方法引入图像分割领域的方法（即FCN网络），其去掉了DNN中最后的全连接层，再经过上采样得到了图像分割结果。Ronneberger O针对医学图像中的分割问题，提出了U-Net方法，这是首个采用“Encoder-Decode......