简介:摘要:针对目前市场上已有的桌面文件整理软件不够智能化,不能根据文件文本信息进行分类的问题,根据文件的标题和文本内容,开发出了一款基于凝聚层次聚类和词袋模型 分类的智能化桌面文件整理软件。聚类算法适用于用户使用初期零散文件较多的情况,将散乱的桌面文件自动划分为不同的类别,并整理成对应的文件夹;分类算法适用于用户后期零散文件继续增加的情况,将各文件匹配到对应文件夹。实验结果表明,在短文本,且样本数量较少的情况下,上述算法能很好地对桌面文件进行类别的划分,聚类和分类的准确率分别达到了90%和86.77%。该软件能很好地解决桌面文件整理问题。
简介:关系数据的聚类算法对于传播研究意义重大,首先运用迭代系统隐喻个体结构的变化,用输出与状态的包含距离表示关系的非对称同时也确定拥有最高结构等级序列的节点来代表簇;再将Hausdorff距离引入DBSCAN算法,使得同结构节点进行合并的加和算子和层次上卷的并算子变得可压缩。运用复杂网络研究人员的数据对算法的有效性进行了评估,分层后的人员合作网具有不同的网络结构特征;关键词在层次2网络中的传播效率高;互惠关系在知识传播中的作用最大。新的发现证明算法通过引入Hutchinson算子的可压缩测度Hausdorff距离使得网络结构对传播效果的影响得以体现,该算法的设计思路是正确的。
简介:摘要本文建立配电网综合评估两层评价体系,指标层包括安全性、可靠性、持续性、效率和效益等五大指标,各指标评价因素由电网负荷、网架结构、设备类型等组成。对各评价因素进行灰色聚类分析,进而评估各因素所属评价集,然后进行多层次模糊评价,得到配电网综合评估结果,能够为电力企业配电网规划建设提供综合评估和决策参考。