%0 Journal Article %T Web文本挖掘中的一种中文分词算法研究及其实现 %A 苏芳仲 %A 林世平 %J 福州大学学报(自然科学版) %D 2004 %X 针对Web文本挖掘中的中文信息处理的问题,介绍了将超文本格式(Html格式)的文档转化为纯文本格式(Txt格式)文档的方法.利用改进的最大匹配法来实现对文档的汉语自动分词,同时,加强消除歧义方面的处理,分词精度有所提高. %K 文本挖掘 %K 字典索引 %K 文档格式转化 %K 消歧 %U http://xbzrb.fzu.edu.cn/ch/reader/view_abstract.aspx?file_no=20040Z1201&flag=1