|
重庆大学学报 2003
一种Web文档在线自适应分类新方法DOI: 10.11835/j.issn.1000-582X.2003.07.012 Keywords: 网页分类,粗集,属性规约,在线自适应分类,Web文档 Abstract: Web文档自动分类是Web挖掘中的重要研究内容。文档向量空间模型(VSM)是实现文档自动分类的基础,但如何排除冗余属性并降低向量空间的维数是一个难点。文中运用粗集理论对由样本文档集合构成的信息系统进行数据泛化,并求取文档的最优规约属性集,大大降低了文档的特征空间的维数,减少了冗余属性对文档分类的干扰,提高了分类效率。运用FuzzyARTMAP(adaptiveresonancetheorymapping)神经网络,利用其自适应分类和增量学习的优良特性,实现了对Web文档的在线自适应分类。
|