山东省青州市范公亭南街12号高新技术研究所
计算机视觉技术应用于蔗糖结晶颗粒识别和粒度分析中的关键是蔗糖图像的分割,分割的质量直接关系到下一步特征提取与参数测量的正确性,进而能够影响到后续的分类识别与特征分析。图像分割算法多种多样,例如Otsu算法、canny算法、分水岭算法等。这些分割算法的速度较快,效果较好,受图像对比度变化、亮度不均和糖膏与晶体亮度相近等因素的影响较小,但是过分割的程度较明显,也没有对分割算法的抗噪性、鲁棒性进行深入的研究。本文采用基于空间邻域信息的二维模糊C均值聚类(Two-Dimensional Fuzzy C-Means,2DFCM)算法进行蔗糖结晶图像分割,并提出7种不同的距离度量作为该算法的相似性度量。分析比较了7种不同距离的2DFCM聚类算法的分割质量与抗噪性,选取最佳的距离作为相似性度量进行图像分割。
1 2DFCM聚类算法
FCM算法进行图像分割时仅利用了像素的灰度信息,并且使用对噪声较敏感的欧氏距离作为像素与聚类中心距离度量的标准,因此抗噪性能较差。为设计对噪声具有鲁棒性的模糊聚类算法,通过在目标函数中引入特定的邻域约束比寻找到一个特定的特征空间映射机制更直接和可行。邻域约束的本质是用邻域信息来影响感兴趣像素的分类。将空间邻域信息融入近似性度量的2DFCM克服了传统FCM算法的缺陷。
在执行2DFCM算法之前,聚类的数目c必须事先确定。先计算其每个像素的8邻域灰度中值。设原始图像有个灰度等级,
为图像中灰度值为
而邻域灰度中值为
的像素点数,M×N 为图像的总像素数,则图像的二维直方图
定义为:
(1)
得到二维直方图后,可以进行高斯平滑,选取平滑后直方图的峰值点作为初始聚类中心,峰值个数作为聚类类别数。
原始图像数据表示为,原始图像经过邻域中值滤波器后得到的数据表示为
。图像的分割问题就是要将二维样本
分成c个聚类,每个聚类由一个二维向量表征
。由马尔科夫随机场理论得知原始图像数据与其滤波数据之间的强相关性,可以用
的分类结果来影响其对应像素
的分类结果,即当
对以
为聚类中心的第
类具有较高的隶属度时,
应该对以
为聚类中心的第j类具有相似的高隶属度。
的分类对
分类的影响程度可以通过一个加权系数控制。在此采用
作为相似性度量的距离度量方式为例,参数
控制邻域惩罚的强度,最佳为6-8之间。
是一个可以控制聚类结果的模糊程度的常数,通常取值为2。根据上述分析,2DFCM的目标函数
可写为:
(2)
约束条件为:
(3)
计算拉拉格朗日目标函数对
的微分极值,代入约束条件得出最小化
的
:
(4)
计算拉拉格朗日目标函数对
与
的微分,求解得出最小化
的
与
解:
(5)
2 2DFCM聚类算法实现
算法实现的具体步骤为:
步骤1:根据式(1)计算二维直方图;
步骤2:对直方图进行高斯滤波,选择平滑后直方图的峰值个数作为聚类类别数,设定聚类中心更新的终止条件ε﹥0;
步骤3:根据二维直方图,选取直方图的峰值点初始化聚类中心(j=1,2…..c);
步骤4:由式(4)更新隶属度矩阵;
步骤5:由式(5)更新聚类中心与邻域聚类中心;
步骤6:计算更新前、后聚类中心的改变量,如果
则停止迭代,否则转步骤4。
3 改进的2DFCM分割与实验结果
2DFCM算法采用距离作为聚类算法的相似性度量,并进行公式推导。本文中对七种不同的距离进行改进,意图找出一个分割质量与抗噪性最佳的距离应用于蔗糖结晶图像2DFCM分割算法。具体距离如下所示:
(1)距离1:带邻域约束的欧氏距离(范数),
(6)
(2)距离2:带邻域约束的范数
(7)
(3)距离3:带邻域约束的曼哈顿距离范数,
(8)
(4)距离4:带邻域约束的混合范数,,
(9)
(5)距离5:带邻域约束的混合范数,
(10)
(6)距离6:带邻域约束的混合范数,
(11)
(7)距离7:带邻域约束的范数,
(12)
针对一幅990*450的蔗糖结晶图像,分别采用七种不同的距离度量进行2DFCM分割,重点考察不同距离度量下的2DFCM分割时间、类别数、信噪比SNR、峰值信噪比PSNR、信噪比改善因子ISNR等参数,得到如下结果。
图1 蔗糖结晶图像
表1针对蔗糖结晶图像的2DFCM分割数据
距离度量 | 次数 | 用时/s | 类别 | SNR | PSNR | ISNR |
距离1 | 29 | 114.77 | 3 | 0.469 | 5.340 | -0.184 |
距离2 | 51 | 239.73 | 4 | 0.871 | 5.558 | 0.032 |
距离3 | 14 | 85.21 | 4 | 1.064 | 5.583 | 0.058 |
距离4 | 1 | 9.33 | 5 | 0.781 | 5.660 | 0.135 |
距离5 | 1 | 12.65 | 4 | 2.045 | 4.953 | -0.572 |
距离6 | 10 | 45.23 | 5 | 0.754 | 5.259 | -0.265 |
距离7 | 1 | 13.75 | 4 | 0.686 | 5.338 | -0.186 |
通过对比可以看出距离4,分割质量较好,收敛速度快,为最佳的距离度量方式下的2DFCM聚类方法