全部 标题 作者 关键词 摘要
Keywords: 文本挖掘,字典索引,文档格式转化,消歧
Full-Text Cite this paper Add to My Lib
针对Web文本挖掘中的中文信息处理的问题,介绍了将超文本格式(Html格式)的文档转化为纯文本格式(Txt格式)文档的方法.利用改进的最大匹配法来实现对文档的汉语自动分词,同时,加强消除歧义方面的处理,分词精度有所提高.
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133