[논문 리뷰] A Python Tool for Object-Centric Process Mining Comparison
이 논문은 PM4PY-MDL 프레임워크 기반의 독립형 파이썬 도구인 OCPC를 제안한다. 이 도구는 프로세스 큐브를 통해 오브젝트 중심 프로세스의 상호작용적 비교를 가능하게 한다. 이는 오브젝트 중심 이벤트 로그(OCEL)의 다차원 슬라이스/다이스 기능을 지원하며, 사용자 정의 가능한 물리화 전략(예: 'Existence' 또는 'All' 오브젝트 조건)을 제공한다. 또한 분할된 OCEL의 내보내기 기능과 함께, 직접 이어짐 그래프 및 오브젝트 중심 페트리 네트워크와 같은 오브젝트 중심 프로세스 모델의 발견 및 양면 비교를 가능하게 한다.
Object-centric process mining provides a more holistic view of processes where we analyze processes with multiple case notions. However, most object-centric process mining techniques consider the whole event log rather than the comparison of existing behaviors in the log. In this paper, we introduce a stand-alone object-centric process cube tool built on the PM4PY-MDL process mining framework. Our infrastructure uses both object and event attributes to build the process cube which leads to different types of materialization. Furthermore, our tool is equipped with the state of the art object-centric process mining techniques. Through our tool the user can visualize the extracted object-centric event log from process cube operations, export the object-centric event log, discover the state-of-the-art object-centric process model for the extracted log, and compare the process models side-by-side.
연구 동기 및 목표
- 다양한 케이스 개념을 지원하는 오브젝트 중심 프로세스 비교 분석을 위한 도구 부족 문제를 해결하기 위해.
- OLAP 스타일의 프로세스 큐브 연산(예: 슬라이스 및 다이스)을 통해 사용자가 OCEL을 탐색할 수 있도록 하기 위해.
- 추출된 OCEL 서브셋에서 오브젝트 중심 프로세스 모델(예: OC-DFG, OC-Petri 넷)의 발견 및 양면 비교를 지원하기 위해.
- 오브젝트 및 이벤트 속성 기반으로 의미 있는 프로세스 큐브 셀을 정의하기 위한 유연한 물리화 전략(예: 'Existence', 'All')을 제공하기 위해.
- 분할된 OCEL 내보내기 및 성능/빈도 주석이 추가된 모델 비교를 통해 프로세스 이해를 향상시키기 위해.
제안 방법
- 도구는 Tkinter GUI를 사용하여 구현되었으며, 프로세스 마이닝 작업을 위해 PM4PY-MDL 프레임워크와 통합되어 있다.
- 입력은 JSON-OCEL 또는 XML-OCEL 형식으로 제공되며, 이벤트와 관련된 오브젝트 및 속성은 별도의 테이블에 저장된다.
- 사용자는 차원(이벤트 및 오브젝트 속성)을 정의하여 프로세스 큐브를 구축하고, 슬라이스 및 다이스 연산을 가능하게 한다.
- 물리화 전략으로는 'Existence'(조건을 만족하는 최소한의 오브젝트 존재)와 'All'(모든 오브젝트가 조건을 만족)가 있으며, 이는 이벤트 세트의 의미적 필터링을 가능하게 한다.
- 도구는 선택된 큐브 셀 기반으로 OCEL 서브셋을 추출하고, 최신 기술을 활용하여 오브젝트 중심 프로세스 모델을 발견한다.
- 프로세스 모델과 이벤트 로그의 양면 비교가 지원되며, 분석을 위한 시각적 및 성능 메트릭이 제공된다.
실험 결과
연구 질문
- RQ1프로세스 큐브를 활용한 다차원적 상호작용 탐색을 통해 오브젝트 중심 프로세스 마이닝은 어떻게 향상될 수 있는가?
- RQ2오브젝트 중심 분석에서 의미 있는 프로세스 큐브 셀을 정의하기 위해 가장 효과적인 물리화 전략은 무엇인가?
- RQ3도구는 분할된 OCEL에서 오브젝트 중심 프로세스 모델의 발견 및 비교를 어떻게 지원하는가?
- RQ4이벤트 수, 이벤트 속성, 오브젝트 속성 측면에서 도구의 확장성은 어떠한가?
- RQ5프로세스 큐브 연산을 통해 오브젝트 중심 프로세스 행동의 변동성을 식별하고 분석하는 데에는 어떤 방식으로 활용될 수 있는가?
주요 결과
- 도구는 Tkinter 기반의 반응성이 뛰어난 GUI를 통해 OCEL의 상호작용적 탐색을 성공적으로 지원한다.
- 물리화 전략('Existence' 및 'All')을 통해 사용자는 오브젝트 존재 여부 또는 조건의 전반적 만족 여부 기반으로 의미 있는 프로세스 큐브 셀을 정의할 수 있다.
- 큐브 구축 시간은 이벤트 수에 따라 선형적으로 증가하며(예: 20,000개 이벤트 시 490.12초), 오브젝트 속성 수에 따라 비선형적으로 증가한다(예: 4개의 오브젝트 속성 시 490.12초).
- 중간 크기의 OCEL에 대해 도구는 합리적으로 잘 확장되며, 20,000개의 이벤트와 4개의 오브젝트 속성이 있는 경우 큐브 구축 시간이 8분 이내이다.
- 도구는 분할된 OCEL 내보내기 및 발견된 오브젝트 중심 모델의 성능 및 빈도 메트릭을 포함한 양면 비교를 지원한다.
- 도구는 오브젝트 중심 프로세스의 비교 분석 가능성을 입증하였으며, 향후 슬라이스/다이스 선택의 자동화 잠재력도 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.