|
计算机科学 2015
基于拓扑信息加速马尔科夫毯学习Keywords: 马尔科夫毯,贝叶斯网络,局部搜索,结构学习,约束学习,条件独立测试 Abstract: 目标变量的马尔科夫毯(mb)是用于预测其状态的最优特征子集。提出一种新的约束学习类mb推导算法fsmb,它遵循后向选择的搜索策略,并依赖条件独立(ci)测试删除任意结点对之间的伪连接。与传统约束学习类算法不同,fsmb能从已执行的ci测试推导出不同结点扮演d分割(dseparation)结点的优先等级;而后基于该信息在未来优先执行条件集中包含高优先级结点的ci测试,从而更快速地判断并删除伪连接边。该策略可帮助快速缩小搜索空间,从而大大提升学习效率。基于仿真网络的实验研究显示,fsmb在计算效率上较经典的pcmb和ipcmb有显著的提升,而学习效果相当;在面对较大网络结构时(比如100和200个结点),甚至比公认最快速的iamb还节省近40%的计算量,但学习效果要远优于iamb。基于16个uci数据集和4个经典的分类模型的实验显示,基于fsmb输出的特征集合所训练模型的分类准确率普遍接近或高于基于原有特征全集训练所得模型。因此,fsmb是快速且有效的mb推导算法。
|