Skip to main content
QUICK REVIEW

[論文レビュー] RapidProM: Mine Your Processes and Not Just Your Data

Wil M. P. van der Aalst, Alfredo Bolt|arXiv (Cornell University)|Mar 10, 2017
Business Process Modeling and Analysis参考文献 10被引用数 40
ひとこと要約

RapidProM は、プロセスマイニング機能を RapidMiner に拡張し、プロセスマイニングと一般的なデータマイニング手法を組み合わせた複雑な分析ワークフローの設計・実行・再利用を可能にする。イベントログ上でプロセス発見、適合性チェック、パフォーマンス分析をサポートし、多様なデータセットおよび分野におけるプロセスマイニング実験の再利用性と自動化を顕著に向上させる。

ABSTRACT

The number of events recorded for operational processes is growing every year. This applies to all domains: from health care and e-government to production and maintenance. Event data are a valuable source of information for organizations that need to meet requirements related to compliance, efficiency, and customer service. Process mining helps to turn these data into real value: by discovering the real processes, by automatically identifying bottlenecks, by analyzing deviations and sources of non-compliance, by revealing the actual behavior of people, etc. Process mining is very different from conventional data mining and machine learning techniques. ProM is a powerful open-source process mining tool supporting hundreds of analysis techniques. However, ProM does not support analysis based on scientific workflows. RapidProM, an extension of RapidMiner based on ProM, combines the best of both worlds. Complex process mining workflows can be modeled and executed easily and subsequently reused for other data sets. Moreover, using RapidProM, one can benefit from combinations of process mining with other types of analysis available through the RapidMiner marketplace.

研究の動機と目的

  • イベントデータのプロセス中心の分析をネイティブにサポートしない既存のデータマイニングツールにおけるギャップを埋める。
  • 一般のデータマイニングパイプラインと統合可能な、複雑でカスタマイズ可能なプロセスマイニングワークフローの作成と再利用を可能にする。
  • RapidMiner のワークフロー・エンジンと ProM の最先端のプロセスマイニングアルゴリズムを組み合わせることで、従来のデータマイニングツールとプロセスマイニングの断絶を解消する。
  • 研究者および実務家が、コンプライアンス、効率性、パフォーマンス改善の観点から、運用プロセスを体系的に分析できるように支援する。
  • 複数のデータセットおよびパrameter設定に対して再現可能でスケーラブルなプロセスマイニング実験を促進する。

提案手法

  • ProM のプロセスマイニングアルゴリズムを RapidMiner のプラグインとして統合し、RapidMiner のビジュアルワークフロー環境を活用する。
  • イベントをプロセスインスタンスの一部として扱う、プロセス発見、適合性チェック、パフォーマンス分析の専用オペレータを提供する。
  • RapidMiner のビジュアルインターフェースを用いて、ループやサブプロセスを含めたパrameter化された実験用に再利用可能な分析ワークフローを構築可能にする。
  • 待ち時間、滞在時間などのパフォーマンス指標をプロセスモデルに投影し、視覚的および統計的分析を可能にする。
  • 処理時間や待ち時間などのパフォーマンスしきい値に基づいて、イベントログのフィルタリングとインタラクティブな探索を可能にする。
  • RapidMiner Marketplace を介してプロセスマイニングと他のデータマイニング技術を統合し、ハイブリッド分析ワークフローを実現する。

実験結果

リサーチクエスチョン

  • RQ1異なるデータセットおよびプロセスタイプにわたるプロセスマイニングワークフローは、どのように効率的に設計・再利用できるか?
  • RQ2プロセスマイニングは、一般用途のデータマイニングプラットフォームにどの程度統合可能で、エンドツーエンドの分析パイプラインを支援できるか?
  • RQ3ワークフローに基づくプロセスマイニングアプローチを用いることで、実世界のイベントログからどのようなパフォーマンスのボトルネックや逸脱が特定できるか?
  • RQ4データマイニングツールとプロセスマイニングを統合することで、プロセス分析のスケーラビリティと再現性はどのように向上するか?
  • RQ5プロセス中心の分析と再利用可能なワークフローの組み合わせは、電子政府や医療分野において、より実行可能なインサイトをもたらすことができるか?

主な発見

  • 「クレジット回収のための送付」アクティビティの平均待ち時間は 17.61 ヶ月であり、プロセス全体における深刻なボトルネックを示している。
  • 「県から結果異議申し立てを受領」アクティビティの平均待ち時間は 5.06 ヶ月であり、外部依存要因による遅延が原因である可能性がある。
  • 「罰金追加」アクティビティの標準偏差はわずか 30 分であり、自動化されたプロセスである可能性が示唆されている。
  • 支払い処理の平均待ち時間は 1.92 ヶ月であり、法的基準の 2 ヶ月に近いが、標準偏差が 4.08 ヶ月と高く、タイミングの不一致が顕著に見られる。
  • データセット内で最も長期間継続したケースは 114.57 ヶ月にのぼり、誤ったイベントログ記録などのデータ品質の問題が懸念される。
  • パフォーマンス指標が規範的プロセスモデルに効果的に投影され、アクティビティごとのパフォーマンスを色分けして可視化し、インタラクティブなフィルタリングが可能になった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。