简介:关联规则研究数据库中一组互不相属对象之间的相关性,挖掘出具有一定意义的关联关系、挖掘算法如Apriori、FP-Growth等,这些算法需要反复多次扫描整个数据库导致I/O负载增加,降低了CPU的性能.文章通过对数据库进行转置和平行变换以减少扫描的次数,从而提高算法效率.
简介:1938年夏4月,西南联合大学文法学院搬迁蒙自,结舍南湖之畔,群彦荟集,对开启地方人文,多所贡献。闻一多、朱自清及诸友生,有南湖诗社之建立。时以国土沦丧,中原洒血,陈寅恪先生感时恨别,因湖寄兴,有“风物长谊似旧京,荷花海子忆升平,桥边鬓影犹明灭,楼上歌声杂醉醒。南渡自应思往事,北归端恐待来生,黄河难塞黄金尽,日暮关山几万重”之咏叹。诸同学亦痛感国难深重,以清醒的现实头脑,深入地方考察,形诸笔端,反映当时社会。如历史系同学朱延辉先生,上个旧,下矿洞,写出《矿工哀》是描述矿工生活血泪斑斑的史诗,朱先生还到建水采风,异龙湖泛舟,写出具有地方特色,民族风情之《建水杂咏竹技词》等,无不再现当时社会生活情景。为昌明地方文化,特探幽发微,补遗救失,讼诸于众,让同学明了大学生参加社会实践早有先驱。领会“生活即教育,社会即学校”的意义。
简介:为了改善真实网络数据集上自动问答系统的性能,定义出新的问题类别集合和通用的答案重新排序模型.问题分类器借助先验词典和语法分析,将语义和语法信息引入信息检索和机器学习方法,呈现为多种多样的训练属性,包括疑问词、中心动词、疑问词与中心动词依赖关系、中心助动词位置、中心名词、中心名词顶级上位词等.进而通过问题类别信息,对问答查询结果重新排序.实验表明:分类器能够精确实现真实网络数据集的问题分类,重新排序后的自动问答结果也能得到明显改善.这说明借助语义和语法信息,真实网络数据集上的自动问答系统等应用可以得到改善,显示出更好的性能.