%0 Journal Article %T 基于SAELBP的网页分类研究 %A 任开新 %A 张旭 %A 江国荐 %A 顾乃杰 %J 中山大学学报(自然科学版) %D 2016 %X 摘要 在网页分类技术中,SVM、BP神经网络和Naive Bayes等传统分类器主要采用了信息增益、互信息和最大熵等模型选取特征.随着深度学习的发展,深层次地选取特征的方法正在被广泛研究.结合稀疏自动编码器(SAE)和LBP神经网络,提出一种基于SAELBP的网页分类器.根据网页文本的半结构化特征,改进了文本特征表示的权重计算.针对网页文本的稀疏性,采用SAE对网页文本进行特征选取.还提出一种基于学习率自动调整的LBP神经网络,有效地降低了训练时间.实验表明,相对于传统的BP神经网络,基于SAELBP的网页分类器的分类正确率提升了5.19%,时间性能提升了83.86%. %K SAE %K LBP %K 网页分类 %K 深度学习 %K 神经网络 %U http://xwxt.sict.ac.cn/CN/abstract/abstract3350.shtml