简介:不确定性是数据的固有属性,在实验过程中由于仪器的限制或者收集过程中的误差都会造成数据的不确定性。数据挖掘算法在处理不确定数据的相关研究尚处于初级阶段,不确定数据聚类是不确定数据研究中的典型问题,已有一些聚类算法被应用到处理不确定数据,如UK-means等。无论是UK-means还是FDBSCAN都仅仅考虑了不确定数据之间的几何距离,而没有考虑到不确定数据之间的概率分布差异。然而,概率分布特征是不确定数据的本质特征,考虑不确定数据的概率分布能够更准确度量不确定数据间的距离,从而提高聚类算法的性能,本文使用核函数度量不确定数据与类中心的距离,然后使用UK-means算法聚类不确定数据,通过大量实验验证了本文提出的距离函数优于使用欧式距离期望的UK-means方法。
简介:合成了新的三氮烯试剂--2-羟基-4-磺酰氨基苯-3-(4-硝基苯)-三氮烯.研究了在TritonX-100表面活性剂存在下与汞的显色反应.在pH=10.0-11.0的Na2B4O7-NaOH缓冲溶液中,该试剂与汞形成2:1型浅黄色配合物.配合物的最大吸收峰位于λ=535nm处,表观摩尔吸光系数为1.21×105L·mol-1·cm-1.Hg2+的浓度在0-12μg/25mL范围内符合比尔定律,相关系数r=0.9994.该方法的检出限量为0.5μg/25mL.用拟定方法测定工业废水中的汞,五次测定的RSD<3%,加标回收率为98.2%-102.5%.
简介:合成了一种未见报道的标题化合物((C9H10N3O2S)2·H2O7Mr=466.54)并得到单晶,晶体衍射实验发现其属于三斜晶系,空间群P-1,配体晶体学参数:α=10.618(3)A,b=10.723(3)A,c=11.943(3)A,α=68.415(4)°,β=69.363(4)°,γ=68.366(4)°,V=1137.8(6)A^3,Z=2,Dc=1.362Mg/m^3,μ(MoKα)=0.269mm^-1。F(000)=488,最终R=0.0635,wR=0.1601,GOF=1.004.配体由两个独立分子和一个水分子组成,通过氢键连接,呈空间立体结构.
简介:k均值算法是一个常用的局部搜索算法,它的主要缺陷是容易陷入局部极小,并且该局部极小解与全局最优解往往有很大的偏差.本文提出一个基于K-均值的迭代局部搜索文档聚类算法.该算法以k均值算法所得到的解作为初始解,从该初始解开始作局部搜索,在搜索过程中接受部分劣解.当解无法改进时,算法对所得到的局部极小解做适当强度的扰动后进行下一次的迭代,以跳出局部极小,从而拓展了搜索的范围.实验结果表明该算法对文档数据集聚类的正确性达99%以上.