|
天津体育学院学报 2015
som和pca对体质健康数据的模式识别及可视化分析――以学生体质地域特征为视角, PP. 282-287 Keywords: 自组织特征映射网络,主成分分析,模式识别,数据可视化,体质健康,地域特征 Abstract: 随着国家学生体质健康数据量的剧增,体质健康的大数据分析及可视化成为体质研究的重要内容。自组织特征映射网络(self-organizingmap,som)方法和主成分分析(principalcomponentanalysis,pca)法对处理高维海量数据具有独特优势及可视化特点,从而成为大数据模式识别和可视化分析的重要工具。以山西某高校6531名学生体质健康数据为例,以学生体质地域差异为视角,用som方法定性识别了学生体质健康的地域特征,用可视化pca方法分析学生体质健康的影响因子及解释因子的地域特征。结论:som和pca方法可用于体质健康数据模式识别和可视化分析。som和pca的实例分析揭示了学生体质的地域特征,分析显示,体重和bmi指标具有地域一致性,是影响学生体质健康的最重要因素,也是学生体质健康现状的主要解释变量;女生体质健康的地域差异相对较大,男生体质健康的地域差异较小;可视化pca结果还揭示了,学生体质健康指标的聚类特征也具有地域一致性。文章从实证角度论证了som和pca方法在体质健康数据模式识别和可视化分析中的应用,也为体质类大数据分析提供了初步思路。
|