简介:摘要本文浅谈了数字图像处理的发展概况、研究背景并对彩色图像K-means算法进行分析.主要详细谈论了是对K-means算法的一些认识,并且介绍K-means聚类的算法思想、工作原理、聚类算法流程、以及对算法结果进行分析,得出其特点及实际使用情况。
简介:不确定性是数据的固有属性,在实验过程中由于仪器的限制或者收集过程中的误差都会造成数据的不确定性。数据挖掘算法在处理不确定数据的相关研究尚处于初级阶段,不确定数据聚类是不确定数据研究中的典型问题,已有一些聚类算法被应用到处理不确定数据,如UK-means等。无论是UK-means还是FDBSCAN都仅仅考虑了不确定数据之间的几何距离,而没有考虑到不确定数据之间的概率分布差异。然而,概率分布特征是不确定数据的本质特征,考虑不确定数据的概率分布能够更准确度量不确定数据间的距离,从而提高聚类算法的性能,本文使用核函数度量不确定数据与类中心的距离,然后使用UK-means算法聚类不确定数据,通过大量实验验证了本文提出的距离函数优于使用欧式距离期望的UK-means方法。
简介:利用粗糙集的约简算法及类边界集分别选出影响绩效的核心因素和样本的边界集,将其应用于C-均值聚类网络得到具有概率信息(权重)的样本,作为支持向量机(SVM)的输入建立员工绩效评估模型。实例表明,该方法拟合率高,且性能优于SVM算法。
简介:摘要在绝大多数情况下,电力变压器油色谱的在线监测数据是正常的,近似故障或者故障类数据是非常少的,数据样本的不平衡就为电力变压器故障诊断增加了难度。基于尽可能早的发现电力变压器内部的发展程度及其潜伏性故障的目的,通过利用ISODATA算法对其油中气成分数据进行聚类分析。实践表明,该算法的具有较强的实用价值。