|
生物化学与生物物理进展 2017
乳腺癌发生的特征基因筛选及模式识别Keywords: 乳腺癌,基因表达,模式识别,肿瘤预测,早期诊断 Abstract: 本文选取癌症基因组图谱数据库的乳腺癌样本作为数据集,在全基因组的水平上研究乳腺癌病人从正常到发病I期基因表达的变化,寻找与乳腺癌发病密切相关的特征基因,建立乳腺癌发生的模式识别分类方法,为乳腺癌预防及早期诊断提供理论支持.研究中综合利用相关性、t检验、置信区间等统计学方法建立乳腺癌发生特征基因筛选方法,获得与乳腺癌发生具有显著性差异的特征基因336个,通过机器学习方法建模,得到的分类准确率能达到98%以上,与之前乳腺癌相关的研究相比,准确率更高.同时采用KEGG (Kyoto Encyclopedia of Genes and Genomes) 通路分析得到与基因显著相关(P<0.05)的通路有8个,GO(Gene Ontology) 基因功能富集分析显示与基因显著相关(P<0.05)的功能有18个,最后对映射在8个通路中的一部分基因进行简要功能分析,说明了其在调控水平上的密切关系,表明识别的特征基因在乳腺癌的发生过程中有重要的作用,这对了解乳腺癌发病机理以及乳腺癌的早期诊断非常重要
|