%0 Journal Article %T 对文本分类评测方法稳定性的研究* %A 龚笔宏 %A 彭波 %J 模式识别与人工智能 %P 12-17 %D 2008 %X 文本分类算法一般采用宏平均精度、宏平均召回率以及宏平均F1值作为评价指标,然而同一个分类器在不同数据集上所得的评测数值往往存在很大差异,使得评测数值只在特定的数据集上有价值,而在其他数据集上没有意义.为了解决这个问题,本文提出3个因素来刻画数据集对分类结果的影响,并利用这3个因素构造一种评测指标newmacroF1.这一评测指标将数据集的因素从评测过程中独立出来,使得newmacroF1表示的仅仅是分类算法本身.实验结果表明使用该评测指标同一分类器在不同的数据集上波动较小.通过分类器在1个数据集上的表现,可以近似计算得到该分类器在另一个数据集上的分类质量. %K 分类技术 %K 评测方法 %K 数据挖掘 %U http://manu12.magtech.com.cn/Jweb_prai/CN/abstract/abstract10171.shtml