Skip to main content
QUICK REVIEW

[논문 리뷰] PLG2: Multiperspective Processes Randomization and Simulation for Online and Offline Settings

Andrea Burattin|arXiv (Cornell University)|2015. 06. 28.
Business Process Modeling and Analysis참고 문헌 28인용 수 33
한 줄 요약

PLG2는 개념 드리프트가 있는 오프라인 로그와 온라인 이벤트 스트림을 모두 시뮬레이션할 수 있는 종합적인 프레임워크를 도입한다. 이는 제어 흐름, 시간, 데이터 관점까지 포함한 랜덤 프로세스 생성을 확장하여, 노이즈와 동적 변화가 있는 대용량 데이터 시나리오를 현실적으로 시뮬레이션할 수 있도록 하여, 다양한 실제와 유사한 조건에서 프로세스 마이닝 알고리즘의 강건한 평가를 가능하게 한다.

ABSTRACT

Process mining represents an important field in BPM and data mining research. Recently, it has gained importance also for practitioners: more and more companies are creating business process intelligence solutions. The evaluation of process mining algorithms requires, as any other data mining task, the availability of large amount of real-world data. Despite the increasing availability of such datasets, they are affected by many limitations, in primis the absence of a "gold standard" (i.e., the reference model). This paper extends an approach, already available in the literature, for the generation of random processes. Novelties have been introduced throughout the work and, in particular, they involve the complete support for multiperspective models and logs (i.e., the control-flow perspective is enriched with time and data information) and for online settings (i.e., generation of multiperspective event streams and concept drifts). The proposed new framework is able to almost entirely cover the spectrum of possible scenarios that can be observed in the real-world. The proposed approach is implemented as a publicly available Java application, with a set of APIs for the programmatic execution of experiments.

연구 동기 및 목표

  • 알고리즘 평가를 위한 골드 스탠다드 모델과 현실적이고 대규모의 프로세스 마이닝 데이터셋 부족 문제를 해결한다.
  • 기존 도구들이 제어 흐름 모델링이나 오프라인 시뮬레이션만 지원하는 한계를 극복한다.
  • 개념 드리프트와 다 perspective 데이터(제어 흐름, 시간, 데이터)를 포함한 온라인 스트리밍 시나리오의 시뮬레이션을 가능하게 한다.
  • 연구자가 다양한 현실적인 프로세스 마이닝 테스트 케이스를 생성하기 위한 유연하고 프로그래밍 가능한 프레임워크를 제공한다.
  • 고속, 다양성, 변동성 등의 대용량 데이터 조건에서 신규 프로세스 마이닝 알고리즘의 개발 및 평가를 지원한다.

제안 방법

  • 행동적 다양성을 위한 확률적 규칙를 포함한 문법 기반 무작위 모델 생성을 통해 이전의 프로세스 생성 프레임워크를 확장한다.
  • 제어 흐름, 시간, 데이터 관점 모두를 지원하는 비즈니스 프로세스의 형식적 내부 표현을 도입한다.
  • 다중 관점 기반 시뮬레이션을 통해 현실적인 노이즈, 시간, 데이터 객체 분포를 반영한 이벤트 로그를 생성한다.
  • 구성 가능한 방출 속도와 동적 개념 드리프트(예: 모델 전환)를 지원하는 연속적이고 무한한 이벤트 스트림 생성을 구현한다.
  • 스트림 생성 중에 서로 다른 프로세스 모델 간 전환을 통해 실제 세계의 프로세스 진화를 시뮬레이션하는 드리프트 메커니즘을 구현한다.
  • 프로그래밍적 및 배치 실행을 위한 자바 기반 API와 독립 실행형 애플리케이션을 제공한다.

실험 결과

연구 질문

  • RQ1제어 흐름, 시간, 데이터 관점의 다 perspective 프로세스 모델을 체계적이고 무작위적으로 생성하여 다양한 평가 시나리오를 지원할 수 있는가?
  • RQ2알려진 기준 모델에서 현실적이고 노이즈가 있는, 다 perspective 이벤트 로그를 생성하여 골드 표준으로 활용할 수 있는가?
  • RQ3동적 개념 드리프트를 포함한 연속적인 온라인 이벤트 스트림을 어떻게 시뮬레이션할 수 있는가? 이는 실제 세계의 프로세스 진화를 반영하기 위함이다.
  • RQ4이 프레임워크는 프로세스 마이닝에서 고속, 다양성, 변동성 등의 대용량 데이터 특성을 어느 정도 시뮬레이션할 수 있는가?
  • RQ5이 프레임워크는 진동하는 조건에서 스트림 기반 프로세스 마이닝 알고리즘의 평가를 어떻게 지원할 수 있는가?

주요 결과

  • PLG2는 제어 흐름, 시간, 데이터 관점의 다 perspective 프로세스 모델을 성공적으로 생성하여 실제 비즈니스 프로세스의 종합적 시뮬레이션을 가능하게 한다.
  • 프레임워크는 실제 프로세스 실행 패턴을 반영한 현실적이고 노이즈가 있는 이벤트 로그 생성을 지원하며, 시간적 편차와 데이터 객체의 변동성을 포함한다.
  • 개념 드리프트가 있는 온라인 스트림 시뮬레이션은 효과적으로 지원되어 시간이 지남에 따라 동적 프로세스 변화를 모델링할 수 있다.
  • 프레임워크는 한 프로세스 모델에서 다른 모델으로의 전환과 같은 진화하는 프로세스 마이닝 시나리오의 시뮬레이션을 가능하게 하여 스트림 기반 알고리즘 테스트에 핵심적이다.
  • 프레임워크는 자바 API를 통해 자동 평가 워크플로우를 지원하여 연구자가 생성된 모델과 로그의 대규모 레포지토리에서 실험을 확장할 수 있다.
  • 사례 연구를 통해 스트림 마이닝 알고리즘이 충분한 관측 후 개념 드리프트가 발생한 이후에도 정확하게 프로세스 모델을 식별할 수 있음을 입증하여, 프레임워크의 현실성과 유용성을 검증한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.