|
中国科学院研究生院学报 2009
A clustering based method to solve duplicate tasks problem
|
Abstract:
流程挖掘是一种从实际业务执行日志中发现结构化流程信息的过程,流程挖掘技术广泛应用于业务流程的发现和辅助建模过程中,并能够通过差异分析的方法帮助改进已有业务流程,如何处理流程模型中的重复任务,是流程挖掘技术的一个关键问题,提出了一个在标准流程挖掘算法执行之前进行的重复任务处理阶段,这一重复任务处理方法可以很好地兼容目前已有的各种流程挖掘算法,使之能处理重复任务,并提出了一种能够将事件记录上下文信息的差别数值化的距离度量定义,使用这种度量能够利用聚类方法来识别输入数据中的重复任务,最后利用典型的带有重复任务的流程模型,对所提出的处理方法进行模拟实验,并取得了良好的实验效果.