%0 Journal Article %T Study on text clustering based on ontology and similarity
基于本体及相似度的文本聚类研究* %A WANG Gang %A QIU Yu-hui %A
王刚 %A 邱玉辉 %J 计算机应用研究 %D 2010 %I %X 为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类忽略概念的内涵及缺少概念间的联系,设计和改进了基于本体和相似度的文本聚类方法TCBOS(text clustering based on ontology and similarity)。研究了文本预处理及分词的方法,设计了用有限状态自动机来自动提取概念和关系的方法,对概念语义扩展和相似度计算方法进行了改进和完善,通过应用本体的语义相似度来度量文档间相近程度,完善了根据相似度进行文本聚类的K中心点算法。实验证明,该方法从聚类的准确性和聚类的关联度方 %K 本体 %K 相似度 %K 文本聚类 %K 语义 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=A9D9BE08CDC44144BE8B5685705D3AED&aid=E03FE510A37BB2BCD08AA0B4AD89EF07&yid=140ECF96957D60B2&vid=DB817633AA4F79B9&iid=DF92D298D3FF1E6E&sid=B69FEB12D9A4855D&eid=03917A4D377EB981&journal_id=1001-3695&journal_name=计算机应用研究&referenced_num=0&reference_num=9