|
中山大学学报(自然科学版) 2018
弱标注环境下基于CNN的汉语句群自动切分Keywords: 弱标注,卷积神经网络,句群切分,句群主题 Abstract: 摘要 句群在汉语语篇中占据重要的地位,实现句群的自动切分可以有效地提升机器翻译以及机器阅读理解的准确率.为了实现汉语句群的自动切分,本文利用卷积神经网络以及注意力机制对语篇句对进行分类,并结合句群主题特征来提升句群边界识别的准确率,利用大规模弱标注段落数据集解决句群语料短缺的难题.数据表明,该方法能够有效地进行句群边界的自动识别,实现句群的自动切分
|