Skip to main content
QUICK REVIEW

[論文レビュー] PROVED: A Tool for Graph Representation and Analysis of Uncertain Event Data

Marco Pegoraro, Merih Seran Uysal|arXiv (Cornell University)|Mar 9, 2021
Business Process Modeling and Analysis参考文献 13被引用数 2
ひとこと要約

PROVEDは、不確実なイベントデータにおけるプロセスマイニングを可能にするPythonベースのツールであり、不確実なトレースを意味論的に明確な行動グラフおよびPetri ネットとしてモデル化する。上界および下界を伴う乖離スコアを用いた、発見、適合性チェック、アライメント計算をサポートし、不確実なデータを破棄せずに、すべての可能な実行シナリオの分析を可能にする。

ABSTRACT

The discipline of process mining aims to study processes in a data-driven manner by analyzing historical process executions, often employing Petri nets. Event data, extracted from information systems (e.g. SAP), serve as the starting point for process mining. Recently, novel types of event data have gathered interest among the process mining community, including uncertain event data. Uncertain events, process traces and logs contain attributes that are characterized by quantified imprecisions, e.g., a set of possible attribute values. The PROVED tool helps to explore, navigate and analyze such uncertain event data by abstracting the uncertain information using behavior graphs and nets, which have Petri nets semantics. Based on these constructs, the tool enables discovery and conformance checking.

研究の動機と目的

  • 活動ラベルなどの属性が曖昧であるか、複数の可能な値をとる不確実なイベントデータを扱えるプロセスマイニングツールの需要が高まっているという課題に対応する。
  • 既存のツールが不確実なデータを破棄または無視するという制限を克服し、不確実性を最初から情報として保存・分析可能にする。
  • 行動グラフおよび意味論的に実行可能なPetri ネットとしてのモデル化により、不確実なプロセストレースの形式的分析を可能にする。
  • 不確実なトレースと規範的モデルとの間の適合性チェックを、最良ケースと最悪ケースの両方のアライメントコストを計算することで支援する。
  • プログラミングを必要としないインタラクティブなインターフェースを提供し、不確実なログ、バリアント、トレース、イベントレベルの不確実性を可視化によって探索可能にする。

提案手法

  • 不確実な属性(例:複数の可能な活動ラベルの集合)を記述するメタ属性を備えた拡張XES形式を用いて、不確実なイベントデータを表現する。
  • 不確実な属性を持つイベント間のすべての可能な先行関係を捉える行動グラフとして、各不確実なトレースをモデル化する。
  • 行動グラフを行動ネット(Petri ネット)に変換することで、形式的な実行意味論とモデルベース分析を可能にする。
  • アライメントアルゴリズムを用いて、不確実なトレース(行動ネットとして)と規範的モデル(Petri ネットとして)との間の適合性スコアを計算する。
  • 最良ケース(最小コスト)と最悪ケース(最大コスト)の両方のアライメント結果を提供し、不確実性の境界を反映する。
  • Webベースのインタラクティブダッシュボードを実装し、不確実なバリアント、個々のトレース、時間区間を伴うガントチャート、不確実性に配慮したPetri ネット表現を可視化可能にする。

実験結果

リサーチクエスチョン

  • RQ1活動ラベルやその他の属性が曖昧または多値であるような不確実なイベントデータは、プロセスマイニングにおいてどのように形式的に表現・分析できるか。
  • RQ2すべての可能なプロセス実現を反映する実行可能意味論を持つ、不確実なプロセストレースを効果的にモデル化する方法は何か。
  • RQ3不確実なイベントデータを扱えるように適合性チェックをどのように拡張すればよいか。特に、規範的モデルからの乖離の上界および下界を提供する方法は何か。
  • RQ4プログラミングを必要としないインタラクティブな不確実プロセスデータの探索を支援するユーザインターフェースパターンとして、どのようなものが最適か。
  • RQ5行動グラフとPetri ネットを効果的に組み合わせることで、不確実プロセス行動のスケーラブルかつ正確な分析を実現できるか。

主な発見

  • PROVEDは、不確実なトレースを行動グラフおよびPetri ネットに変換することで、不確実なイベントデータを形式的にモデル化し、実行可能で分析可能な状態にしている。
  • 不確実なトレースと規範的モデルとの間で、最良ケースと最悪ケースの両方のアライメントコストを計算しており、表1の例では最悪ケースコストが2である。
  • 行動ネット表現により、不確実なトレースのすべての可能な実現が実行可能となり、並列実行、選択、スキップ動作が保持される。
  • インタラクティブダッシュボードにより、不確実なバリアントの探索、個々のトレースへのドリルダウン、ガントチャートおよびテーブルビューによる不確実性の可視化が可能である。
  • 不確実性に配慮したメタデータを備えた完全なXESインポート/エクスポートをサポートしており、既存のプロセスマイニングワークフローへの統合が可能である。
  • 二重アライメントアプローチにより、乖離の可能性範囲が明確になり、不確実プロセス分析における透明性が向上する診断的インサイトを提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。