[論文レビュー] Clustering Object-Centric Event Logs
本稿では、オブジェクト中心イベントログ(OCEL)における類似オブジェクトをグループ化することで、複雑なオブジェクト中心プロセスモデルを単純化するクラスタリングベースの手法を提案する。二つのイベント割り当て戦略('existence' および 'all')を導入し、クラスタリング中に重複や損失を回避することで、複雑さが低減され、解釈性が向上したプロセスモデルを実現するとともに、適合性を維持する。
Process mining provides various algorithms to analyze process executions based on event data. Process discovery, the most prominent category of process mining techniques, aims to discover process models from event logs, however, it leads to spaghetti models when working with real-life data. Therefore, several clustering techniques have been proposed on top of traditional event logs (i.e., event logs with a single case notion) to reduce the complexity of process models and discover homogeneous subsets of cases. Nevertheless, in real-life processes, particularly in the context of Business-to-Business (B2B) processes, multiple objects are involved in a process. Recently, Object-Centric Event Logs (OCELs) have been introduced to capture the information of such processes, and several process discovery techniques have been developed on top of OCELs. Yet, the output of the proposed discovery techniques on real OCELs leads to more informative but also more complex models. In this paper, we propose a clustering-based approach to cluster similar objects in OCELs to simplify the obtained process models. Using a case study of a real B2B process, we demonstrate that our approach reduces the complexity of the process models and generates coherent subsets of objects which help the end-users gain insights into the process.
研究の動機と目的
- 複数の相互作用するオブジェクトを含む実生活のビジネスツービジネス(B2B)プロセスから導出されるプロセスモデルの複雑さに対処すること。
- OCELにおける類似オブジェクトのクラスタリングにより、オブジェクト中心プロセスマイニング(OCPM)におけるモデルの複雑さを低減すること。
- オブジェクトの同質的かつ一貫性のあるサブセットとそれに対応する単純化されたプロセスモデルを生成することで、エンドユーザーが明確なイン사이트を得られるようにすること。
- クラスタリングにおける収束を処理するため、二つのイベント割り当て戦略('existence' および 'all')を導入・評価すること。
提案手法
- 注文、バッチ、顧客を含む実際のB2B製造プロセスからOCELを抽出した。
- クラスタリングの品質を向上させるために、中心性指標などのグラフベースの属性をOCELに付加した。
- クラスタリングの対象となるオブジェクトタイプ(例:バッチ)を選定し、階層的クラスタリングおよびk-meansクラスタリングアルゴリズムを適用した。
- 二つのイベント割り当て戦略を提案した:'existence'(クラスタ内の少なくとも1つのオブジェクトが関係する場合にイベントを割り当てる)および 'all'(すべてのオブジェクトがクラスタ内に存在する場合にのみイベントを割り当てる)。
- クラスタからサブ-OCELを生成し、プロセス発見(OC-DFG)を適用して単純化され、解釈可能なプロセスモデルを導出した。
- 結果として得られるOC-DFGモデルの品質を評価するための複雑さの指標を導入した。
実験結果
リサーチクエスチョン
- RQ1OCELにおけるオブジェクトクラスタリングは、モデル適合性を損なわせることなく、発見されたプロセスモデルの複雑さをどのように低減できるか?
- RQ2クラスタリングベースのOCEL単純化において、'existence'戦略と 'all' 戦略の間にはどのようなトレードオフがあるか?
- RQ3OCELにおける類似オブジェクトのクラスタリングは、実際のB2B製造プロセスにおいて意味的で一貫性のあるサブプロセスを明らかにできるか?
- RQ4中心性などのグラフベースの付加情報は、OCELにおけるオブジェクトクラスタリングの品質をどのように向上させるか?
- RQ5提案手法は、異なるプロセスバリアントを区別できるほど、単純化され、解釈可能なプロセスモデルをどの程度生成できるか?
主な発見
- 提案されたクラスタリング手法は、初期のOC-DFGモデルの複雑さを成功裏に低減したが、適合性は比較的高い水準を維持した。
- 'all' 戦略はイベントの重複を回避したが、複数のクラスタにまたがるオブジェクトを含むイベントを損なうリスクがあった。一方、'existence' 戦略はすべてのイベントを保持したが、重複のリスクを伴った。
- 中心性などのグラフベースの付加情報の使用により、プロセス内でのオブジェクトの構造的役割を捉えることができ、クラスタリングの品質が向上した。
- 最終的なクラスタリングモデルは、異なる品目タイプに対する処理フローの違いといった明確なプロセスバリアントを明らかにした。これは、本手法が意味的で一貫性のあるサブプロセスを分離できることを示している。
- 実際のB2B製造プロセスを対象とした事例研究から、本手法は単純化され、一貫性があり、解釈可能なプロセスモデルを生成でき、複雑なワークフローを理解するのをユーザーに支援することが可能であることが示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。