%0 Journal Article %T News Text Event Extraction Driven by Event Sample
基于事件实例驱动的新闻文本事件抽取 %A XU Xu-yang %A LI Bi-cheng %A ZHANG Xian-fei %A HAN Yong-feng %A
许旭阳 %A 李弼程 %A 张先飞 %A 韩永峰 %J 计算机科学 %D 2011 %I %X 目前,事件抽取的流行方法是以事件元素或触发词进行驱动,但该方法容易导致正反例不平衡,且在语料库规模较小时存在一定的数据稀疏问题。提出了一种基于事件实例驱动的事件抽取方法。首先,从文档句子中抽取出刻画一个事件发生有代表性的特征,构成候选事件实例表示;其次,通过二元分类器对新闻文本中的事件实例与非事件实例进行分类;最后,对事件实例采用基于层次聚类的k-mcdoids算法完成事件抽取。该方法不仅克服了正反例失衡以及数据稀疏问题,而且解决了预先定义事件类别的局限性。实验结果验证了该方法的有效性,对比传统方法,事件抽取的准确率与召回率均获得了显著的提高。 %K Event sample %K Classification %K News text %K Clustering %K Event extraction
事件实例,分类,新闻文本,聚类,事件抽取 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=64A12D73428C8B8DBFB978D04DFEB3C1&aid=2AC66EB828B1E4355BDE9429C8AA5D3E&yid=9377ED8094509821&vid=16D8618C6164A3ED&iid=5D311CA918CA9A03&sid=E1D946F217E3B046&eid=6CCE24D86D03D083&journal_id=1002-137X&journal_name=计算机科学&referenced_num=0&reference_num=0