|
软件学报 2010
从图数据库中挖掘频繁跳跃模式, PP. 2477-2493 Keywords: 数据挖掘,图挖掘,图数据库,频繁子图,跳跃模式 Abstract: 很多频繁子图挖掘算法已被提出.然而,这些算法产生的频繁子图数量太多而不能被用户有效地利用.为此,提出了一个新的研究问题:挖掘图数据库中的频繁跳跃模式.挖掘频繁跳跃模式既可以大幅度地减少输出模式的数量,又能使有意义的图模式保留在挖掘结果中.此外,跳跃模式还具有抗噪声干扰能力强等优点.然而,由于跳跃模式不具有反单调性质,挖掘它们非常具有挑战性.通过研究跳跃模式自身的特性,提出了两种新的裁剪技术:基于内扩展的裁剪和基于外扩展的裁剪.在此基础上又给出了一种高效的挖掘算法graphjp(analgorithmforminingjumppatternsfromgraphdatabases).另外,还严格证明了裁剪技术和算法graphjp的正确性.实验结果表明,所提出的裁剪技术能够有效地裁剪图模式搜索空间,算法graphjp是高效、可扩展的.
|