全部 标题 作者 关键词 摘要
Keywords: 网络化制造,制造资源,垂直搜索,页面解析,中文分词,lucene
Full-Text Cite this paper Add to My Lib
?着重研究了网络化制造资源垂直搜索系统的主题爬虫和中文分词技术。通过在主题爬虫中增加评价网页模块,优先爬行与主题相似度高的网页中的链接,提高了爬虫的工作效率。在对中文分词词典进行分层存储的基础上,通过一种改进的简洁的中文分词词典匹配算法,有效地改善了分词的速度与精度,并缩减了索引库,增强了用户的响应。
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133