%0 Journal Article %T 基于AdaBoost法在代谢综合征不平衡数据分类中的应用<br>Based on the application of AdaBoost+decision tree for metabolic syndrome with imbalanced data %A 闫慈 %A 田翔华 %A 阿拉依?阿汗 %A 张伟文 %A 曹明芹 %J 现代预防医学 %D 2017 %X 目的 (1)针对医疗数据不平衡的特点,以代谢综合征为例,通过比较单纯决策树与AdaBoost+决策树分类代谢综合征的性能,从而确定AdaBoost+决策树在医疗不平衡数据挖掘中的优点,为计算机辅助诊断代谢综合征提供方法学参考。(2)采用决策树探讨代谢综合征的影响因素。方法 采用AdaBoost平衡代谢综合征数据,并比较数据平衡前后决策树建模的性能,采用F-value,G-mean和AUC分析评价模型。结果 (1)相较于单纯决策树,AdaBoost+决策树的F-value值提高6.3%,G-mean提高3.5%,AUC提高0.4%,分别表明采用AdaBoost+决策树分类代谢综合征患者识别的性能提高6.3%,数据整体的分类精度提高3.5%;模型的综合分类能力提高0.4%。(2)探讨决策树影响因素均显示:空腹血糖、高密度脂蛋白、收缩压、年龄、体重指数是代谢综合征的主要影响因素。此外,在本研究中,决策树提示:若FPG>6.02,BMI>24.99,SBP>139,age≤46,则患有代谢综合征;若FPG≤6.02,HDL-C≤0.99,BMI≤24.99,age≤61,则不患代谢综合征。结论 采用AdaBoost+决策树的性能优于决策树,使用决策树所得结果与相关专业研究中代谢综合征影响因素相同。<br> %K 代谢综合征 %K AdaBoost %K 决策树 %K 不平衡数据集< %K br> %U http://xdyfyxzz.paperopen.com/oa/DArticle.aspx?type=view&id=20172104