|
生物化学与生物物理进展 2005
gopipe:批量序列的geneontology注释和统计分析Keywords: gene,ontology,功能基因组学,est,blast,interproscan,goa Abstract: 随着后基因组时代的到来,批量的测序,特别是est的测序,逐渐成为普通实验室的日常工作.这些新的序列往往需要进行批量的geneontology(go)的注释及随后的统计分析.但是目前除了goblet以外,并没有软件适合对未知序列进行批量的go注释,而goblet因为具有上载量的限制,以及仅仅利用blast作为预测工具,所以仍有许多不足之处.开发了一个软件包gopipe,通过整合blast和interproscan的结果来进行序列注释,并提供了进一步作统计比较的工具.主程序接收任意个blast和interproscan的结果文件,并依次进行文本分析、数据整合、去除冗余、统计分析和显示等工作.还提供了统计的工具来比较不同输入对go的分布来挖掘生物学意义.另外,在交集工作模式下,程序取interproscan和blast结果的交集,在测试数据集中,其精确度达到99.1%,这大大超过了interproscan本身对go预测的精确度,而敏感度只是稍微下降.较高的精确度、较快的速度和较大的灵活性使它成为对未知序列进行批量geneontology注释的理想的工具.上述软件包可以在网站(http://gopipe.fishgenome.org/)免费获得或者与作者联系获取.
|