|
计算机科学 2004
基于图结构的候选序列生成算法Keywords: 图结构候选序列频繁序列数据挖掘序列挖掘 Abstract: 先生成候选序列再判断候选序列是否为频繁序列,最后获得频繁序列是序列数据挖掘中基于候选序列挖掘算法的一般结构,如apriori类算法,gsp算法,spade算法等。因此,研究候选序列生成算法具有普遍意义。本文首先研究了序列数据集(序列数据库)与图结构间的关系,证明了一个序列是频繁序列的必要条件是该序列对应于一个完全子图。以此为基础提出了基于图结构的候选序列生成算法,文中给出了算法正确性证明。在t25110d10k和t25120d100k数据集上的挖掘实验表明在本文提出的候选序列生成算法上进行挖掘比用apri
|