全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
软件学报  2010 

基于参考集索引的高效序列相似性查找算法

, PP. 718-731

Keywords: 序列相似性查找,参考集索引,编辑距离

Full-Text   Cite this paper   Add to My Lib

Abstract:

序列数据在文本、web访问日志文件、生物数据库中普遍存在,对其进行相似性查找是一种重要的获取和分析知识的手段.基于参考集索引技术是一类解决序列相似性查找的有效方法,主要思想是找到序列数据库中的少数序列作为参考集,通过参考集过滤掉数据库中与查询序列不相关的数据,从而高效地回答查询.在现有基于参考集索引技术的基础上,提出一种过滤能力更强的序列相似性查询算法iri(improvedreferenceindexing).首先,充分利用了先前的查询结果集来加速当前的查询,其次考虑了基于序列特征的上界和下界,使得应用参考集进行过滤的上下界更紧,过滤能力进一步加强.最后,为了避免候选集中费时的编辑距离计算,则只计算前缀序列间的编辑距离,从而进一步加速算法运行.实验采用真实的dna序列和蛋白质序列数据,结果表明,算法iri在查询性能上明显优于现有的基于参考集索引方法ri(referenceindexing).

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133