Web紧密核的抽取和评价方法

(整期优先)网络出版时间:2008-03-13
/ 1
针对web社区的发现和链接分析技术的一些关键问题,基于面向主题的技术,重点研究了二分图的特征,引入了Х二分核集来更为明确地定义抽取的方法.通过扫描主题子图构造Х二分图,对该子图的(i,j)裁剪后得到Х二分核集,这也是社区的最小元素.最后,对所抽取的所有Х二分核集应用层次聚类的方法得到社区内部结构的树状图,证明了构造和裁剪方法的正确性并设计了算法.实验采用HITS(hyperlink-inducedtopicsearch)算法中的典型数据集获取方法,选择了10个主题和4个搜索引擎并综合返回的结果.采用社会网中测量社区结构强度的模块化度量来验证所提方法的有效性,实验结果表明所提方法是有效并可行的.