简介:为了改善真实网络数据集上自动问答系统的性能,定义出新的问题类别集合和通用的答案重新排序模型.问题分类器借助先验词典和语法分析,将语义和语法信息引入信息检索和机器学习方法,呈现为多种多样的训练属性,包括疑问词、中心动词、疑问词与中心动词依赖关系、中心助动词位置、中心名词、中心名词顶级上位词等.进而通过问题类别信息,对问答查询结果重新排序.实验表明:分类器能够精确实现真实网络数据集的问题分类,重新排序后的自动问答结果也能得到明显改善.这说明借助语义和语法信息,真实网络数据集上的自动问答系统等应用可以得到改善,显示出更好的性能.
简介:单次脑电分类实验中,采用基于logistic回归的正则化方法来提高分类准确率.首先,提出一种新算法——局部保持投影稀疏logistic回归,将局部保持投影正则项加入到稀疏logistic回归中.该算法旨在保留原始特征空间邻域信息的同时保证结果的稀疏性.然后,利用边界优化法和逐分量迭代算法在训练集上求解权重向量,克服了牛顿一拉夫森法和迭代重加权最小二乘法的局限性.最后,在自步调手指运动数据集上采用十重交叉验证法得到80%的分类准确率,并与稀疏logistic回归的实验结果进行对比,说明局部保持投影正则项有效地保留了对脑电分类有用的信息.