5.3 改进的FCM聚类分割算法
依据图像数据集中的簇的重叠程度可以将聚类分割算法分为硬性聚类算法和模糊聚类算法。硬性聚类算法体现了对象与簇之间的非此即彼的关系,即严格地把每个待聚类的对象分类到某个簇中,设图像的数据集为X={x1,x2,…,xn},其分类的数目为c,且满足条件(2≤c≤n);假设将数据集X划分为互不重叠的c个簇,使得任何一个X中的样本点均属于某一个簇,并且每一个簇中最少有一个样本点,那么这个硬性聚类算法的聚类结果就可以表示为一个c×n阶的矩阵U,则数据集中的第j类可以表示为ujk,其表达式见式(5-7)。通常在实践中事物间的边界限并不是很分明,就会出现模糊划分的聚类算法,而模糊集合理论又为模糊聚类算法提供了优良的数学工具。模糊聚类算法矩阵U中元素的取值并不只局限于0与1这两个值,而是在0与1之间的区间上取值,因而此时的硬性聚类算法就转变为模糊聚类算法。
硬性聚类算法一般采用最小平方误差和作为其聚类准则,设vj(j=1,2,…,c)是该聚类的聚类中心,djk代表图像数据集中的第j类样本xk到聚类中心vj的距离,各簇中样本到聚类中心的距离平方和用J(U,V)表示,则此硬性聚类算法的目标函数表示为式(5-8)或式(5-9),并且当用迭代算法来求取最小的J(U,V)时,就可以找到最佳的图像矩阵与聚类中心的配对,即(U,V);模糊聚类算法一般采用拉格朗日乘数法求目标函数,设xk、vj都是q维向量,∀xk,vj∈Rq,A是q×q的矩阵,A∈Mqq,数据集中的样本xk与聚类中心vj之间距离的平方表示为(djk)2,其表达式见式(5-10),其中T表示矩阵的转置,且A为对称矩阵,当A=I时,式(5-10)转化为欧式距离,该模糊聚类算法的目标函数的表达式见式(5-11),利用约束条件,∀k可求得J(U,V)的最小值,从而找到最佳的ujk与vj。
HCM聚类算法是典型的硬性聚类算法,该算法收敛速度较快,但由于此算法只能将图像中的样本点以概率0和1划分到各个簇中,因此该方法不能够充分表现出客观事物的模糊特性,因而在实际的图像分割中往往会产生错误分割。相反,模糊聚类算法中的一种典型算法FCM算法就可以解决HCM算法中不能充分表达事物模糊性的这一缺陷,该算法在图像分割中利用隶属度函数解决了像素同时属于多个不同类别的可能性问题;该算法能够避免阈值的设定问题,并能解决阈值分割中多个分支的分割问题;该算法可以形成较细致的特征空间,其分割结果不会像硬聚类分割那样产生某种偏差;该算法的聚类过程是自动进行的,是无监督的聚类方法,因而该算法在图像分割领域被广泛应用。
FCM算法的图像分割的步骤如下:设待分割的图像为M,其分割门限为∂,然后对该图像采用迭代优化方案求其FCM算法中目标函数J(U,V)的最小值。首先,确定图像的聚类数目c(2≤c≤n)以及加权指数m(m∈[2,∞]);接着,初始化模糊聚类矩阵U,其初始值U(l)=[μi(x,y)l],且l=0;然后,依据式(5-12)计算各个簇的聚类中心vi并且计算新的模糊聚类矩阵Ul+1,再依据式(5-13)和式(5-14)分别计算M(x,y)、;若M(x,y)=∅,则满足式(5-15),反之,若M(x,y)≠∅,则满足式(5-16);最后,检查U(l-1)-U(l)的值是否小于FCM算法预先设的阈值,若该值小于此阈值则标志着FCM算法结束,图像分割已完成,反之,若该值大于或等于FCM算法预先设的阈值,则算法就会继续计算新的聚类中心,当达到停止条件时停止,此时算法收敛后,其分割图像可表示为式(5-17)。
影响FCM聚类算法分割质量的因素如下:
1)FCM聚类算法的初始隶属度矩阵,该矩阵直接影响FCM聚类算法是否能找到最佳的聚类中心以及影响FCM聚类算法的运算时间和迭代次数。
2)FCM聚类算法的对称矩阵,该矩阵的矩阵形式直接影响FCM聚类算法的聚类分布,是球状分布、条状分布、带形分布、矩形分布还是菱形分布等。
3)FCM聚类算法的聚类数目,这个参数直接影响FCM聚类算法的运算时间,假如此数目很大,其运算时间就会成倍增加,因而此时该算法在一般的实验设备就难以完成。
4)FCM聚类算法的加权指数,该参数控制着模糊聚类的类间模糊程度,若该加权指数变大,则分类矩阵模糊程度就会变大;当该加权指数趋于无穷的时候,隶属度矩阵中的元素均接近1/c(c为聚类的总数),此时隶属度矩阵就失去了意义。
5)FCM聚类算法的阈值设定,如果阈值设置得太大,则每次运算的聚类结果就会有较大的差异,且聚类结果也不稳定;反之,如果阈值设置得太小,则该算法的运算量就会增加,从而导致运算时间变长以及产生该算法不能收敛的结果。
因此,改进FCM聚类算法的分割效果实质就是对以上几个因素的改进,本章对传统的FCM聚类算法进行了如下改进:
1)隶属度矩阵的改进:利用图像中像素的空间特征加强原有的隶属度函数,使同类区域的邻域像素携带少量的噪声点的权重,最终获得较准确的聚类中心;改进的隶属度迭代公式见式(5-18),其中p、q分别为控制原有隶属度和控制空间函数间关系的参数;改进隶属度后得到的聚类中心的迭代函数的公式见式(5-19)。
2)对称矩阵的选择:根据图像的聚类分布对应地选择出对称矩阵的形式。
3)聚类数目的确定:本章采用结合阈值分割的分水岭算法中的分水岭盆地的个数作为初始的聚类数目,从而解决了传统的FCM聚类算法不能自动确定总的聚类数目的问题。
4)加权指数的确定:对于不同的图像,加权指数也具有不同的取值范围,但加权指数有一个经验范围是[1,1.5],之后又从物理上求出,当加权指数取2的时候,其表示的模糊聚类的类间模糊程度最有意义。
5)阈值设定:本章采用结合梯度特征的最大类间方差法无监督、自适应地确定了多源图像的分割阈值,从而为FCM聚类算法收敛到较好的聚类结果奠定了一定的基础。
因此,通过上述改进的FCM聚类分割算法可以求出新的目标函数的表达式为式(5-20),并且用迭代算法可求出目标函数J(U,V)最小值,从而得到最佳的图像矩阵与聚类中心的配对,即(U,V),最终完成聚类分割的目的。
因此,本章采用结合空间特征的FCM聚类算法对分水岭算法进行改进操作,从而形成了结合改进的FCM聚类分割的分水岭算法,该算法减弱了分水岭算法易受图像中的量化误差的影响;与此同时该算法也归并了图像中那些细微的无语义学意义的过分割的小区域,使得被分割的目标轮廓更为清晰;并且该算法进一步改善了传统分水岭算法中易产生过分割的缺陷,最终得到具有较高分割质量的图像。本章采用VC++6.0开发环境编程调试完成的结合空间特征的FCM聚类分割算法对结合阈值算法的分水岭分割图像进行图像分割,其分割结果分别如图5-2和图5-3所示,其中图5-2为可见光图像的结合聚类算法的分水岭分割图像,图5-3为红外图像的结合聚类算法的分水岭分割图像。
图5-2 可见光图像的结合聚类算法的分水岭分割图像
图5-3 红外图像的结合聚类算法的分水岭分割图像