%0 Journal Article %T 人源microRNA前体的全基因组预测 %A 应晓敏 %A 朱娟娟 %A 王小磊 %A 赵东升 %A 付汉江 %A 郑晓飞 %A 李伍举 %J 中国科学 生命科学 %P 958-964 %D 2011 %R 10.1360/052011-614 %X microRNA(miRNA)是一类不编码蛋白的调控小分子RNA,在真核生物中发挥着广泛而重要的调控功能.由于miRNA的表达具有时空特异性,因而通过计算方法预测miRNA而后有针对性的实验验证是miRNA发现的一条重要途径.降低假阳性率是miRNA预测方法面临的重要挑战.本研究采用集成学习方法构建预测miRNA前体的分类器SVMbagging,对训练集、测试集和独立测试集的结果表明,本研究的方法性能稳健、假阳性率低,具有很好的泛化能力,尤其是当阈值取0.9时,特异性高达99.90%,敏感性在26%以上,适合于全基因组预测.采用SVMbagging在人全基因组中预测miRNA前体,当取阈值0.9时,得到14933个可能的miRNA前体.通过与高通量小RNA测序数据的比较,发现其中4481个miRNA前体具有完全匹配的小RNA序列,与理论估计的真阳性数值非常接近.最后,对32个可能的miRNA进行实验验证,确定其中2条为真实的miRNA. %K miRNA %K 预测 %K 机器学习 %K 集成学习 %U http://life.scichina.com:8082/sciC/CN/abstract/abstract504994.shtml