|
中山大学学报(自然科学版) 2016
RABBIC:基因表达数据的基因模块发现Abstract: 摘要 发现基因模块是生物信息学数据分析的一个重要研究内容.本文定义基因模块为一组基因,其表达水平在一个样本子集中的每一样本上都有完全相同或相反的大小顺序.为了从高维度的基因表达数据中发现有意义的基因模块,提出一种基于Rank(序)的双向聚类算法——RABBIC(RAnk-Based BIClustering algorithm).RABBIC算法对模拟数据集和真实数据的聚类分析都获得良好的性能评价,RABBIC算法发现了TCGA提供的卵巢癌基因表达数据的451个基因模块,其中93个同时满足显著性、准确性和相关性的要求.经基因集功能富集分析,得到了25个可能具有重要的生物医学意义的基因模块
|