|
计算机科学 2007
dnaresm:一个基于多支持度的dna重复序列挖掘算法Keywords: 数据挖掘dna序列重复序列序列模式 Abstract: dna序列分析研究是生物信息学的重要内容之一。基因组的基因相关区域和基因外区域中含有大量重复序列,尽管目前大多数重复序列的功能还没能肯定,但它们在遗传分析中已起重要作用。挖掘dna重复序列成为dna序列分析的关键。自底向上的挖掘算法中间过程产生很多短的、甚至单字符的模式,使得挖掘效率降低;另一方面,目前序列模式挖掘算法在多序列挖掘中表现出高效性,但由于单支持度定义的局限导致无法在挖掘过程中同时找到单条dna序列中的重复序列,因此不能很好地适用于dna重复序列挖掘。本文基于新的多支持度序列模式挖掘框架,提出
|