Skip to main content
QUICK REVIEW

[論文レビュー] Generating Time-Based Label Refinements to Discover More Precise Process Models

Niek Tax, Emin Alasgarov|arXiv (Cornell University)|May 25, 2017
Business Process Modeling and Analysis被引用数 1
ひとこと要約

本論文は、スマートホームのイベントデータから発見されるプロセスモデルの正確性を向上させるために、時系列に基づくラベル精錬を自動で生成するフレームワークを提案する。時間的属性を活用して意味的に類似したイベントを区別することで、より洞察に富んだモデルを実現する。実証的評価により、戦略的に組み合わせることで、精錬されたラベルがモデルの特異性と有用性を顕著に向上させることを示している。

ABSTRACT

Process mining is a research field focused on the analysis of event data with the aim of extracting insights related to dynamic behavior. Applying process mining techniques on data from smart home environments has the potential to provide valuable insights in (un)healthy habits and to contribute to ambient assisted living solutions. Finding the right event labels to enable the application of process mining techniques is however far from trivial, as simply using the triggering sensor as the label for sensor events results in uninformative models that allow for too much behavior (overgeneralizing). Refinements of sensor level event labels suggested by domain experts have been shown to enable discovery of more precise and insightful process models. However, there exists no automated approach to generate refinements of event labels in the context of process mining. In this paper we propose a framework for the automated generation of label refinements based on the time attribute of events, allowing us to distinguish behaviourally different instances of the same event type based on their time attribute. We show on a case study with real life smart home event data that using automatically generated refined labels in process discovery, we can find more specific, and therefore more insightful, process models. We observe that one label refinement could have an effect on the usefulness of other label refinements when used together. Therefore, we explore four strategies to generate useful combinations of multiple label refinements and evaluate those on three real life smart home event logs.

研究の動機と目的

  • スマートホーム環境において、過度に一般化されたイベントラベルが原因で情報のないモデルが生成されるという課題に対処すること。
  • イベントの時間的属性を活用して意味のあるラベル精錬を自動で生成する手法を開発すること。
  • 複数のラベル精錬がプロセスモデルの正確性に与える影響を評価し、効果的な組み合わせ戦略を同定すること。
  • 複数のラベル精錬を組み合わせた際、個々の精錬が互いの有効性にどのように影響を与えるかを調査すること。
  • 実世界のスマートホームイベントログを用いて、時系列ベースのラベル精錬の実用的有用性を示すこと。

提案手法

  • フレームワークは、イベントの時間的属性を分析することで、同じイベントタイプの行動的に異なるインスタンスを区別し、自動的にラベル精錬を生成する。
  • 時間的パターンが類似するイベントをグループ化するため、時系列クラスタリングまたはパーティショニング技術を適用して精錬ラベルを生成する。
  • 複数のラベル精錬を組み合わせるための4つの異なる戦略を提案する:逐次的、並列的、グリーディー、ヒューリスティックベースの組み合わせ。
  • 精錬ラベルを含むイベントログに対してプロセス発見アルゴリズム(例:Alpha Miner、Heuristics Miner)を適用し、より正確なプロセスモデルを生成する。
  • 実際のスマートホームイベントデータを用いて、異なる精錬戦略におけるモデルの正確性と洞察力の違いを比較評価する。
  • 複数の精錬の相関関係を分析することで、1つの精錬が他の精錬の有用性に与える影響を評価する。

実験結果

リサーチクエスチョン

  • RQ1イベントの時間的属性をどのように活用すれば、より正確なプロセスモデルラベルを自動で生成できるか?
  • RQ2複数の時系列ベースのラベル精錬を組み合わせる際に、モデル品質を向上させるために最も効果的な戦略は何か?
  • RQ3複数のラベル精錬を組み合わせた際、1つの精錬が他の精錬の有用性にどのように影響を与えるか?
  • RQ4時系列ベースの精錬は、実際のスマートホームデータにおける発見されたプロセスモデルの正確性と洞察力の両面で、どの程度向上をもたらすか?

主な発見

  • 時系列ベースのラベル精錬により、イベントラベルの過剰一般化を低減することで、発見されたプロセスモデルの正確性が顕著に向上する。
  • 複数の精錬を組み合わせることで、単独での精錬よりもより洞察に富んだモデルが得られるが、その有効性は選択された戦略に依存する。
  • 1つの精錬が他の精錬の有用性を低下させる場合があり、これは知的な組み合わせ戦略の必要性を示唆している。
  • ヒューリスティックベースの組み合わせ戦略が、他の戦略に比べ、より特異性と解釈可能性の高いモデルを生成する点で優れていた。
  • 実際のスマートホームログを用いた実証的評価により、精錬されたラベルが、より行動的に正確で実行可能なプロセスモデルをもたらすことが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。