%0 Journal Article %T 基于事件分析的Web地震新闻时空信息挖掘研究 Web based extraction of spatiotemporal information of earthquake event by semantic technology %A 樊红 %A 李怀远 %A 杜武 %A 杨继文 %J 武汉大学学报(工学版) %D 2018 %X 针对Web地震新闻挖掘的需求,采用网络爬虫抓取新闻文本作为研究语料,采用改进的TF-IDF(Term Frequency-Inverse Document Frequency)算法对语料集进行文本训练,选取权值较大的特征词初步识别地震类文档;采用特征词构成要素描述地震事件,构建了地震事件的知识框架;基于框架的要素特征词匹配从地震类文档中获取候选事件语句,对候选事件语句进行句法分析,总结出地震要素出现形式和规律,构造抽取规则,编写抽取算法,完成了地震事件识别和提取实验,并对地震事件提取的精度进行分析和评价,验证了该方法具有较高的地震事件识别和提取精度,是一种有前景的Web专题事件挖掘的途径 %K Web地震新闻 %K 信息挖掘 %K 事件框架 %K 文本分析 %U http://wsdd.cbpt.cnki.net/WKC/WebPublication/paperDigest.aspx?paperID=2909d7df-c44c-4c25-b491-b4c0645d453b