Skip to main content
QUICK REVIEW

[論文レビュー] PLG2: Multiperspective Processes Randomization and Simulation for Online and Offline Settings

Andrea Burattin|arXiv (Cornell University)|Jun 28, 2015
Business Process Modeling and Analysis参考文献 28被引用数 33
ひとこと要約

PLG2は、概念的ずれを伴うオフラインログおよびオンラインイベントストリームの両方をシミュレートする包括的なフレームワークを提供する。制御フロー、時間、データの視点を含むランダムプロセス生成を拡張し、ノイズや動的変化を伴うビッグデータシナリオの現実的なシミュレーションを可能にすることで、多様で現実に近い条件下でのプロセスマイニングアルゴリズムの耐障害的評価を支援する。

ABSTRACT

Process mining represents an important field in BPM and data mining research. Recently, it has gained importance also for practitioners: more and more companies are creating business process intelligence solutions. The evaluation of process mining algorithms requires, as any other data mining task, the availability of large amount of real-world data. Despite the increasing availability of such datasets, they are affected by many limitations, in primis the absence of a "gold standard" (i.e., the reference model). This paper extends an approach, already available in the literature, for the generation of random processes. Novelties have been introduced throughout the work and, in particular, they involve the complete support for multiperspective models and logs (i.e., the control-flow perspective is enriched with time and data information) and for online settings (i.e., generation of multiperspective event streams and concept drifts). The proposed new framework is able to almost entirely cover the spectrum of possible scenarios that can be observed in the real-world. The proposed approach is implemented as a publicly available Java application, with a set of APIs for the programmatic execution of experiments.

研究の動機と目的

  • アルゴリズムの評価に向けたゴールドスタンダードのプロセスマodelと現実的で大規模なプロセスマイニングデータセットの不足に対処する。
  • 制御フローのモデリングやオフラインシミュレーションのみをサポートする既存ツールの制限を克服する。
  • 概念的ずれとマルチペルスペクティブデータ(制御フロー、時間、データ)を伴うオンラインストリーミングシナリオのシミュレーションを可能にする。
  • 研究者が多様で現実的なプロセスマイニングのテストケースを生成できる柔軟でプログラマティックなフレームワークを提供する。
  • ビッグデータ条件、特に高速度、多様性、可変性を伴う状況下での、新しいプロセスマイニングアルゴリズムの開発と評価を支援する。

提案手法

  • 行動のばらつきを表現するための確率的ルールを備えた文法ベースのランダムモデル生成を含む、先行するプロセス生成フレームワークの拡張。
  • 制御フロー、時間、データの視点をサポートする、ビジネスプロセスの形式的内部表現の導入。
  • 現実的なノイズ、タイミング、データオブジェクトの分布を反映するイベントログのマルチペルスペクティブシミュレーションの実装。
  • 設定可能な発生レートと動的かつ概念的ずれ(例:モデル遷移)を伴う、連続的・無限のイベントストリーム生成のサポート。
  • ストリーム生成中に異なるプロセスマデルを切り替えることで、現実のプロセス進化を模倣するずれ機構の実装。
  • プログラム的およびバッチ実行の両方を可能にするJavaベースのAPIとスタンドアロンアプリケーションの提供。

実験結果

リサーチクエスチョン

  • RQ1制御フロー、時間、データのマルチペルスペクティブプロセスマデルを、多様な評価シナリオをサポートするために体系的かつランダムに生成する方法は何か?
  • RQ2既知の基準プロセスマデルから、現実的でノイズを含み、マルチペルスペクティブなイベントログを生成する方法は何か? これによりゴールドスタンダードとしての役割を果たす。
  • RQ3動的かつ概念的ずれを伴うオンラインで連続するイベントストリームを、現実のプロセス進化を反映させるようにシミュレートする方法は何か?
  • RQ4このフレームワークは、プロセスマイニングにおける高速度、多様性、可変性といったビッグデータの特性をどの程度シミュレートできるか?
  • RQ5このフレームワークは、現実的で進化を遂げる条件下で、ストリームベースのプロセスマイニングアルゴリズムの評価をどの程度支援できるか?

主な発見

  • PLG2は、制御フロー、時間、データの視点を備えたマルチペルスペクティブプロセスマデルを効果的に生成し、現実のビジネスプロセスの包括的シミュレーションを可能にした。
  • フレームワークは、タイミングのずれやデータオブジェクトのばらつきを含む、実際のプロセス実行パターンを反映する現実的でノイズを含むイベントログの生成をサポートした。
  • 概念的ずれを伴うオンラインストリームシミュレーションが効果的にサポートされ、時間の経過に伴う動的プロセス変化のモデリングが可能になった。
  • フレームワークは、1つのプロセスマデルから別のプロセスマデルへの遷移といった、進化するプロセスマイニングシナリオのシミュレーションを可能にした。これはストリームベースのアルゴリズムのテストに不可欠である。
  • Java APIを介した自動評価ワークフローのサポートにより、研究者が生成されたモデルやログの大きなリポジトリを対象に、スケーラブルな実験を実施できるようになった。
  • 事例研究により、ストリームマイニングアルゴリズムが十分な観測後、概念的ずれの後でもプロセスマデルを正しく同定できることを示した。これにより、フレームワークの現実性と実用性が裏付けられた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。