Skip to main content
QUICK REVIEW

[論文レビュー] A Python Extension to Simulate Petri nets in Process Mining

Mahsa Pourbafrani, Sandhya Vasudevan|arXiv (Cornell University)|Jan 1, 2021
Business Process Modeling and Analysis参考文献 11被引用数 4
ひとこと要約

本論文は、PM4Py向けのPythonベースのオープンソース拡張機能を提示する。このツールは、離散イベントシミュレーション(DES)を用いて、実際のプロセスイベントログから自動的にシミュレートされたイベントログを生成する。プロセスモデル(ペトリネット)とパフォーマンスデータ(所要時間、到着レート)を抽出することで、ユーザー定義パラメータを用いた「仮説的」分析が可能となり、元のプロセスのフローおよびタイミング行動を保持する現実的でタイムスタンプ付きのイベントログが生成される。

ABSTRACT

The capability of process mining techniques in providing extensive knowledge and insights into business processes has been widely acknowledged. Process mining techniques support discovering process models as well as analyzing process performance and bottlenecks in the past executions of processes. However, process mining tends to be "backward-looking" rather than "forward-looking" techniques like simulation. For example, process improvement also requires "what-if" analyses. In this paper, we present a Python library that uses an event log to directly generate a simulated event log, with additional options for end-users to specify the duration of activities and the arrival rate. Since the generated simulation model is supported by historical data (event data)and it is based on the Discrete Event Simulation (DES) technique, the generated event data is similar to the behavior of the real process.

研究の動機と目的

  • 既存のプロセスマイニングツールに前向きなシミュレーション機能が欠如している問題に対処すること。
  • 深くシミュレーションの専門知識を必要とせずに、自動的かつデータ駆動型のビジネスプロセスのシミュレーションを可能にすること。
  • 実際のプロセスデータから得られる構造的および時間的特性を保持する現実的なシミュレート済みイベントログを生成すること。
  • ユーザーがアクティビティの所要時間や到着レートを調整できる柔軟な「仮説的」シナリオ分析を支援すること。

提案手法

  • ツールは元のイベントログを出発点とし、プロセスマイニングを適用してペトリネットモデルを同定する。
  • 統計解析と分布フィッティングを用いて、イベントログからアクティビティの所要時間と到着レートを抽出する。
  • Pythonの離散イベントシミュレーションエンジン(SimPy)を用いて、ペトリネットとユーザー定義パラメータに基づくプロセス実行をシミュレートする。
  • シミュレーションは、容量制限に達した場合のキューイングを含め、ケースのアクティビティを通過する進行を追跡する。
  • シミュレーションクロックを実際のタイムスタンプに変換し、イベントを新しいイベントログ形式に記録する。
  • 最終出力は、ケースID、アクティビティ、タイムスタンプ属性を備えたシミュレート済みイベントログであり、さらなるプロセスマイニング分析に適している。

実験結果

リサーチクエスチョン

  • RQ1プロセスマイニングツールは、手動でのモデル作成を要せず、実際のイベントログから自動的にシミュレート済みイベントログを生成できるか?
  • RQ2歴史的データとユーザー定義パラメータのみを用いて、シミュレート済みイベントログが元のプロセスのタイミングおよびフロー行動をどの程度正確に再現できるか?
  • RQ3ユーザー定義パラメータ(例:アクティビティの所要時間、到着レート)が、シミュレート済みイベントログの現実性および有用性にどの程度影響を与えるか?
  • RQ4シミュレート済みイベントログを用いて、元のプロセスモデルを高い忠実度で再発見できるか?これはシミュレーションの妥当性を示す。

主な発見

  • ツールは、元のプロセスの構造的および時間的特性を保持するシミュレート済みイベントログを効果的に生成しており、シミュレートログから同じペトリネットモデルを再発見したことで確認された。
  • 容量制限に起因する現実的なキューイング行動が、シミュレート済みログに含まれており、実世界のボトルネックを暗黙的に反映している。
  • ユーザーがアクティビティの所要時間や到着レートを変更できる柔軟な「仮説的」分析が可能であり、シナリオベースのパフォーマンス評価が促進される。
  • シミュレート済みログは、標準的なプロセスマイニングツールと互換性があり、元のログとシミュレートログの両方で一貫したモデル発見結果が得られた。
  • ツールはオープンソースであり、学術的利用事例でも検証済みで、多様なシミュレーションシナリオにおいて堅牢性と使いやすさを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。