全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

Web文本挖掘中的一种中文分词算法研究及其实现

Keywords: 文本挖掘,字典索引,文档格式转化,消歧

Full-Text   Cite this paper   Add to My Lib

Abstract:

针对Web文本挖掘中的中文信息处理的问题,介绍了将超文本格式(Html格式)的文档转化为纯文本格式(Txt格式)文档的方法.利用改进的最大匹配法来实现对文档的汉语自动分词,同时,加强消除歧义方面的处理,分词精度有所提高.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133