%0 Journal Article %T Chinese text clustering algorithm using semantic list
基于语义列表的中文文本聚类算法 %A MA Su-qin %A SHI Hua-ji %A LI Xing-yi %A
马素琴 %A 施化吉 %A 李星毅 %J 计算机应用研究 %D 2010 %I %X 针对大多数基于向量空间模型的中文文本聚类算法存在高维稀疏、忽略词语之间的语义联系、缺少聚簇描述等问题,提出基于语义列表的中文文本聚类算法CTCAUSL(Chinese text clustering algorithm using semantic list)。该算法采用语义列表表示文本,一个文本的语义列表中的词是该文本中出现的词,从而降低了数据维数,且不存在稀疏问题;同时利用词语间的相似度计算解决了同义词近义词的问题;最后用语义列表对聚簇进行描述,增加了聚类结果的可读性。实验结果表明,CTCAUSL算法在处理大量文本数据方面具有较好的性能,并能明显提高中文文本聚类的准确性。 %K text clustering %K text representation %K semantic list %K similarity calculation %K cluster representation
文本聚类 %K 文本表示 %K 语义列表 %K 相似度计算 %K 聚簇表示 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=A9D9BE08CDC44144BE8B5685705D3AED&aid=627C0EF61C446CB9B2AF056931740BF8&yid=140ECF96957D60B2&vid=DB817633AA4F79B9&iid=94C357A881DFC066&sid=A87AC493625B15AF&eid=7101D1EC58F693A9&journal_id=1001-3695&journal_name=计算机应用研究&referenced_num=0&reference_num=10