Skip to main content
QUICK REVIEW

[논문 리뷰] Defining Cases and Variants for Object-Centric Event Data

Jan Niklas Adams, Daniel Schuster|arXiv (Cornell University)|2022. 01. 01.
Business Process Modeling and Analysis인용 수 1
한 줄 요약

이 논문은 객체 중심 이벤트 데이터에서 이벤트가 다수의 객체 유형과 연결될 수 있는 시스템에서의 프로세스 마이닝을 가능하게 하기 위해, 기존의 사례 개념을 그래프 기반 일반화로 확장한 프로세스 실행을 제안한다. 연결된 부분 그래프를 추출하고, 그래프 이somorphism을 사용하여 동일한 프로세스 행동을 식별함으로써 저자들은 객체 중심 변형을 정의하고, 실제 로그에서 이러한 변형을 시각화하기 위한 확장 가능한 레이아웃 기법을 제공한다.

ABSTRACT

The execution of processes leaves traces of event data in information systems. These event data can be analyzed through process mining techniques. For traditional process mining techniques, one has to associate each event with exactly one object, e.g., the company's customer. Events related to one object form an event sequence called a case. A case describes an end-to-end run through a process. The cases contained in event data can be used to discover a process model, detect frequent bottlenecks, or learn predictive models. However, events encountered in real-life information systems, e.g., ERP systems, can often be associated with multiple objects. The traditional sequential case concept falls short of these object-centric event data as these data exhibit a graph structure. One might force object-centric event data into the traditional case concept by flattening it. However, flattening manipulates the data and removes information. Therefore, a concept analogous to the case concept of traditional event logs is necessary to enable the application of different process mining tasks on object-centric event data. In this paper, we introduce the case concept for object-centric process mining: process executions. These are graph-based generalizations of cases as considered in traditional process mining. Furthermore, we provide techniques to extract process executions. Based on these executions, we determine equivalent process behavior with respect to an attribute using graph isomorphism. Equivalent process executions with respect to the event's activity are object-centric variants, i.e., a generalization of variants in traditional process mining. We provide a visualization technique for object-centric variants. The contribution's scalability and efficiency are extensively evaluated. Furthermore, we provide a case study showing the most frequent object-centric variants of a real-life event log.

연구 동기 및 목표

  • 각 이벤트가 단일 객체(사례)에 속한다고 가정하는 전통적 프로세스 마이닝의 한계를 해결하기 위해, 이벤트가 다수의 객체 유형과 연결될 수 있는 객체 중심 이벤트 데이터로 사례 개념을 확장한다.
  • 객체 중심 로그를 전통적 이벤트 로그로 평탄화함으로써 발생하는 정보 손실과 구조적 왜곡을 해결한다.
  • 그래프 구조의 이벤트 데이터에서 의미 있는 종단 간 프로세스 행동 단위(이하 프로세스 실행)를 추출하는 방법을 개발한다.
  • 그래프 이somorphism을 기반으로 한 동치성 클래스로 객체 중심 변형을 정의함으로써, 다양한 객체 유형을 통해 반복되는 프로세스 패턴을 분석할 수 있도록 한다.
  • 실제 사용자들이 복잡한 다중 객체 프로세스 패턴을 직관적으로 이해할 수 있도록 지원하기 위해, 객체 중심 변형을 시각화하기 위한 확장 가능한 레이아웃 알고리즘을 제공한다.

제안 방법

  • 객체 그래프의 연결된 부분 그래프로 프로세스 실행을 정의하며, 각 부분 그래프는 상호의존적인 객체들 간의 일관된 이벤트 시퀀스를 나타낸다.
  • 프로세스 실행을 객체 중심 이벤트 그래프에서 식별하고 추출하기 위해 연결 성분과 주요 유형 적용 기법을 두 가지 추출 기법으로 사용한다.
  • 프로세스 실행 간의 비교를 위해 그래프 이somorphism 알고리즘을 적용하고, 구조적 및 활동 유사성 기반으로 동치성 클래스로 그룹화한다.
  • 이러한 동치성 클래스를 객체 중심 변형으로 정의하며, 이는 이질적이고 다중 객체 프로세스에 대한 기존의 변형 개념을 일반화한다.
  • 사용자 친화적인 그래프 기반 형식으로 객체와 이벤트를 배열함으로써 객체 중심 변형을 시각화하는 레이아웃 알고리즘을 설계한다.
  • 실제 및 합성 로그에서의 성능 측정을 통해 확장성을 평가하며, 이벤트 수와 각 변형당 객체 수에 비례한 실행 시간을 측정한다.

실험 결과

연구 질문

  • RQ1이벤트가 다수의 객체와 연결될 수 있는 객체 중심 이벤트 데이터를 다룰 수 있도록 기존의 프로세스 마이닝 사례 개념을 어떻게 일반화할 수 있는가?
  • RQ2그래프 구조의 객체 중심 이벤트 로그에서 종단 간 프로세스 행동 단위(사례에 해당하는 유사 단위)를 효과적이고 손실 없는 방법으로 어떻게 추출할 수 있는가?
  • RQ3객체 중심 데이터에서 동일한 프로세스 행동을 어떻게 식별할 수 있으며, 이러한 행동 간의 의미적 및 구조적 일관성을 보장하기 위한 기준은 무엇인가?
  • RQ4실제 사용자가 복잡한 다중 객체 프로세스 패턴을 이해할 수 있도록 지원하는 확장 가능하고 직관적인 시각화 기법은 무엇인가?
  • RQ5제안된 방법은 이벤트 수와 각 변형당 객체 수가 증가함에 따라 어떻게 확장되는가?

주요 결과

  • 연결 성분과 주요 유형 적용 기반의 제안된 프로세스 실행 추출 기법은 객체 중심 이벤트 그래프에서 의미 있고 일관된 프로세스 행동 단위를 성공적으로 추출한다.
  • 그래프 이somorphism 기반의 동치성 검사 기법은 정확한 객체 중심 변형 식별을 가능하게 하며, 대출 신청 사례 연구에서 11%의 프로세스 실행이 가장 빈번한 변형을 형성한다.
  • 레이아웃 알고리즘이 효율적으로 확장되며, 실행 시간이 이벤트 수와 각 동치성 클래스당 객체 수에 비례하여 예측 가능하게 증가함으로써 실용적 타당성을 입증한다.
  • 실제 대출 신청 프로세스 사례 연구에서 다섯 가지의 구분 가능한 객체 중심 변형이 밝혀졌으며, 이는 다수의 오퍼와 취소/수락 시퀀스를 포함한 빈번한 패턴을 포함한다.
  • 객체 중심 변형의 시각화는 동시성과 객체 간 상호작용 패턴에 대한 직관적이고 실용적인 통찰을 제공한다. 예를 들어, 오퍼 생성 시점과 고객 커뮤니케이션의 시기 등을 명확히 드러낸다.
  • 정보 손실 없이 구조적 및 의미적 정보를 유지함으로써, 평탄화 기법보다 우수한 성능을 보이며, 실제 ERP 및 제조 데이터에서 더 정확하고 의미 있는 프로세스 마이닝을 가능하게 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.