|
中山大学学报(自然科学版) 2019
一种基于关键词扩展的答案块提取模型Keywords: 机器阅读理解,非定长答案,关键词扩展,块提取 Abstract: 摘要 针对问答式机器阅读理解中非定长答案的提取问题,本文提出了一种基于关键词扩展的答案块提取模型.该模型首先确定答案所在区块的中心词,即将文本与问题进行联合处理后计算问题关于联合向量的注意力值并按列输入softmax函数,将此概率分布矩阵逐列相加后遍历全文,检索出答案所在区块的中心词.然后,以该词为中心进行答案块扩展,并在每次扩展后计算答案块与问题向量之间的相似程度,相似度开始减小时停止扩展以优化候选答案块的质量.相较于以往的答案块提取模型,该模型一方面不再依赖于词性标注,另一方面大大提高了答案块的生成效率,在简化模型的同时提高了机器阅读理解的准确性.实验结果表明,该模型在SQuAD测试数据集上的EM(Exact Match)和F1值均表现优异,分别获得了65.7%和74.3%的准确度
|