Skip to main content
QUICK REVIEW

[論文レビュー] Defining Cases and Variants for Object-Centric Event Data

Jan Niklas Adams, Daniel Schuster|arXiv (Cornell University)|Jan 1, 2022
Business Process Modeling and Analysis被引用数 1
ひとこと要約

本稿では、イベントが複数のオブジェクトタイプに関連付けられるシステムにおけるプロセスマイニングを可能にする、従来のケースのグラフベースの一般化としてのプロセス実行を導入する。連結部分グラフの抽出とグラフ同型性を用いた同等のプロセス行動の特定により、オブジェクト中心のバリアントを定義し、実世界のログにおけるこれらのバリアントの可視化にスケーラブルなレイアウト技術を提供する。

ABSTRACT

The execution of processes leaves traces of event data in information systems. These event data can be analyzed through process mining techniques. For traditional process mining techniques, one has to associate each event with exactly one object, e.g., the company's customer. Events related to one object form an event sequence called a case. A case describes an end-to-end run through a process. The cases contained in event data can be used to discover a process model, detect frequent bottlenecks, or learn predictive models. However, events encountered in real-life information systems, e.g., ERP systems, can often be associated with multiple objects. The traditional sequential case concept falls short of these object-centric event data as these data exhibit a graph structure. One might force object-centric event data into the traditional case concept by flattening it. However, flattening manipulates the data and removes information. Therefore, a concept analogous to the case concept of traditional event logs is necessary to enable the application of different process mining tasks on object-centric event data. In this paper, we introduce the case concept for object-centric process mining: process executions. These are graph-based generalizations of cases as considered in traditional process mining. Furthermore, we provide techniques to extract process executions. Based on these executions, we determine equivalent process behavior with respect to an attribute using graph isomorphism. Equivalent process executions with respect to the event's activity are object-centric variants, i.e., a generalization of variants in traditional process mining. We provide a visualization technique for object-centric variants. The contribution's scalability and efficiency are extensively evaluated. Furthermore, we provide a case study showing the most frequent object-centric variants of a real-life event log.

研究の動機と目的

  • イベントが1つのオブジェクト(ケース)に属するという従来のプロセスマイニングの制限を克服するため、イベントが複数のオブジェクトに関連付けられるオブジェクト中心のイベントデータにおいて、ケースの概念を拡張すること。
  • オブジェクト中心のログを従来のイベントログに平坦化することによる情報損失と構造的歪みを回避すること。
  • グラフ構造のイベントデータから意味のある、エンド・トゥ・エンドのプロセス行動ユニット(以下、プロセス実行)を抽出する手法を開発すること。
  • グラフ同型性に基づく等価クラスとしてのオブジェクト中心のバリアントを定義し、複数のオブジェクトタイプにまたがる繰り返し現れるプロセスパターンの分析を可能にすること。
  • 実務家が複雑な複数オブジェクトプロセスパターンを直感的に解釈できるように支援する、スケーラブルな可視化アルゴリズムを提供すること。

提案手法

  • プロセス実行を、相互に依存するオブジェクトを横断する一貫したイベントのシーケンスを表す、オブジェクトグラフの連結部分グラフとして定義する。
  • プロセス実行をオブジェクト中心のイベントグラフから特定・抽出するための2つの手法(連結成分法とリーディングタイプ適用法)を用いる。
  • プロセス実行同士を比較し、構造的・アクティビティ的類似性に基づいて等価クラスにグループ化するため、グラフ同型性アルゴリズムを適用する。
  • これらの等価クラスとしてのオブジェクト中心のバリアントを定義し、異種で複数のオブジェクトを含むプロセスに一般化された従来のバリアント概念を拡張する。
  • オブジェクトとイベントを人間が読みやすいグラフ形式で配置するレイアウトアルゴリズムを設計する。
  • 実データおよび合成データログを用いた実験により、実行時間とイベント数、およびバリアントあたりのオブジェクト数の関係を測定することで、スケーラビリティを評価する。

実験結果

リサーチクエスチョン

  • RQ1イベントが複数のオブジェクトに関連付けられるオブジェクト中心のイベントデータを扱うために、従来のプロセスマイニングにおけるケース概念をどのように一般化できるか?
  • RQ2グラフ構造のオブジェクト中心イベントログから、エンド・トゥ・エンドのプロセス行動ユニット(ケースに類似)を効果的かつ損失のない方法で抽出するにはどうすればよいか?
  • RQ3オブジェクト中心データにおいて同等のプロセス行動をどのように特定できるか。また、その行動間に意味的・構造的整合性を保証する基準は何か?
  • RQ4複雑な複数オブジェクトプロセスパターンを実務家が解釈できるように支援する、スケーラブルで直感的な可視化技術は何か?
  • RQ5本手法は、イベント数やバリアントあたりのオブジェクト数が増加するに従い、どのようにスケーリングするか?

主な発見

  • 連結成分法とリーディングタイプ適用法の2つのプロセス実行抽出手法は、オブジェクト中心のイベントグラフから意味的かつ一貫性のあるプロセス行動ユニットを効果的に抽出できた。
  • グラフ同型性に基づく等価性チェックにより、オブジェクト中心のバリアントを正確に特定でき、ローン申請の事例研究では11%のプロセス実行が最も頻度の高いバリアントを形成した。
  • レイアウトアルゴリズムは効率的にスケーリングされ、実行時間はイベント数および等価クラスあたりのオブジェクト数に比例して予測可能に増加し、実用的妥当性が裏付けられた。
  • 実際のローン申請プロセスの事例調査では、5つの明確に異なるオブジェクト中心のバリアントが特定され、複数のオファー関連パターンやキャンセル/受諾のシーケンスを含む頻度の高いパターンが明らかになった。
  • オブジェクト中心のバリアントの可視化により、オファー作成タイミングや顧客とのコミュニケーションタイミングといった、並列実行やオブジェクト間相互作用のパターンに関する直感的で実行可能なインサイトが得られた。
  • 構造的・意味的情報を保持する点で、平坦化手法を上回る性能を示し、実世界のERPおよび製造業データにおけるより正確で意味のあるプロセスマイニングを可能にした。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。