|
软件学报 2002
基于扩展角分类神经网络的文档分类方法(英文), PP. 871-878 Keywords: 文档分类,cc4神经网络,数据索引,距离信息 Abstract: cc4神经网络是一种三层前馈网络的新型角分类(cornerclassification)训练算法,原用于元搜索引擎anvish的文档分类.当各文档之间的规模接近时,cc4神经网络有较好的分类效果.然而当文档之间规模差别较大时,其分类性能较差.针对这一问题,本文意图扩展原始cc4神经网络,达到对文档有效分类的效果.为此,提出了一种基于mds-nn的数据索引方法,将每一文档映射至k维空间数据点,并尽可能多地保持原始文档之间的距离信息.其次,通过将索引信息变换为cc4神经网络接受的0,1序列,实现对cc4神经网络的扩展,使其能够接受索引信息作为输入.实验结果表明对相互之间规模差别较大的文档,扩展cc4神经网络的性能优于原始cc4神经网络的性能.同时,扩展cc4神经网络的分类精度与文档索引方法有密切关系.
|