|
计算机应用 2014
基于改进朴素贝叶斯的区间不确定性数据分类方法Abstract: ?基于parzen窗的朴素贝叶斯在区间不确定性数据分类中存在计算复杂度高、空间需求大的不足。针对该问题,提出一种改进的区间不确定性数据分类方法iu-pnbc。首先采用parzen窗估计区间样本的类条件概率密度函数(ccpdf);然后通过代数插值得到类条件概率密度函数的近似函数;最后利用近似代数插值函数计算样本的后验概率,并用于预测。通过人工生成的仿真数据和uci标准数据集验证了算法假设的合理性以及插值点数对iu-pnbc算法分类精度的影响。实验结果表明,当插值点数大于15时,iu-pnbc算法的分类精度趋于稳定,且插值点数越多,算法分类精度越高;该算法可以避免原parzen窗估计对训练样本的依赖,并有效降低计算复杂度;同时由于该算法具有远低于基于parzen窗的朴素贝叶斯的运行时间和空间需求,因此适合解决数据量较大的区间不确定性数据分类问题。
|