|
哈尔滨工业大学学报 2012
基于主动学习的中文问题分类数据集构建DOI: 10.11918/j.issn.0367-6234.2012.05.025, PP. 125-128 Keywords: 主动学习,Passive,Aggressive算法,特征选择,中文问题分类 Abstract: 为解决在开放领域问题回答问题中语料规模较小、难以满足问题分类训练需要的问题,用主动学习方法来构建中文问题分类数据集,根据主动学习的方法进行中文问题类别标注,并且通过主动式特征选择方法来提升性能.实验结果表明:在使用主动学习方法时可以快速收敛到最佳准确率(85%),在使用人工标注特征下特征集明显的减小.基于主动学习的标注方法在需要较小人工标注同时取得很好的分类性能,并且在一定程度上还可以明显提高问题分类的准确率
|