%0 Journal Article %T 无关语获取与语料聚类方法研究 %A 周峰 %A 朱俊武 %A 童林 %A 陈伟聪 %A 陈波 %J 南京师范大学学报(自然科学版) %D 2014 %X 剔除无关语及语料聚类对提高自然语言理解的质量具有重要意义,也是自然语言理解的预处理关键技术.鉴于无关语在语料中存在明显的特性,本文通过种子无关语推导出强无关语,并依据强无关语识别并导出新的无关语;然后,基于2-gram构建句子之间的相似性,利用层次法对语料进行聚类对qa语料进行问题相似的聚类.最后,通过识别的新无关语实验及语料聚类实验,验证本文提出方法的有效性. %K 无关语 %K 获取 %K 识别 %K 算法 %U http://njsfdxzrb.paperonce.org/oa/darticle.aspx?type=view&id=201404026