Skip to main content
QUICK REVIEW

[論文レビュー] Practical Aspect of Privacy-Preserving Data Publishing in Process Mining

Majid Rafiei, Wil M. P. van der Aalst|arXiv (Cornell University)|Jan 1, 2020
Business Process Modeling and Analysis被引用数 3
ひとこと要約

この論文では、プロセスマイニングにおけるプライバシー保護技術を実装・オーケストレーションする、PythonベースでWeb統合されたインfraストラクチャを提示する。このインフラは、標準的および変換済みイベントデータの両方をサポートし、明示的なメタデータを通じてプライバシー保護の変更を追跡し、データの有用性と機密性のバランスを取るために、単一または複数の技術を柔軟にデプロイ可能である。

ABSTRACT

Process mining techniques such as process discovery and conformance checking provide insights into actual processes by analyzing event data that are widely available in information systems. These data are very valuable, but often contain sensitive information, and process analysts need to balance confidentiality and utility. Privacy issues in process mining are recently receiving more attention from researchers which should be complemented by a tool to integrate the solutions and make them available in the real world. In this paper, we introduce a Python-based infrastructure implementing state-of-the-art privacy preservation techniques in process mining. The infrastructure provides a hierarchy of usages from single techniques to the collection of techniques, integrated as web-based tools. Our infrastructure manages both standard and non-standard event data resulting from privacy preservation techniques. It also stores explicit privacy metadata to track the modifications applied to protect sensitive data.

研究の動機と目的

  • 実世界のプロセスマイニング応用におけるプライバシー保護技術の実用的統合のニーズに対応すること。
  • 理論的なプライバシー解決策と運用上のデプロイメントのギャップを埋めるために、デプロイ可能でツールベースのインフラストラクチャを提供すること。
  • プロセスマイニングにおけるプライバシー変換によって生じる標準的でないイベントデータと標準的イベントデータの両方を管理すること。
  • 明示的なプライバシー用メタデータを通じて、プライバシー保護の変更を追跡できること。
  • 統一されたフレームワーク内で、個々の技術または複合技術の柔軟な使用を可能にすること。

提案手法

  • インフラは、さまざまなプライバシー保護技術向けのモジュラーなコンponentsを備えたPythonベースのシステムとして実装されている。
  • 複数の最先端のプライバシー保護技術を、プロセスマイニング用に統合的かつ相互運用可能なフレームワークに統合している。
  • システムは、標準的イベントデータと、プライバシー保護変換によって変更されたデータの両方をサポートしている。
  • イベントデータに適用されたすべての変更を記録するため、明示的なプライバシー用メタデータを格納・管理している。
  • プロセスアナリストがアクセス可能で実用的な使用が可能なように、Webベースのツールとしてインフラを公開している。
  • 個々の技術から複数技術の複合ワークフローに至るまでの階層的使用モデルを提供している。

実験結果

リサーチクエスチョン

  • RQ1プロセスマイニングにおけるプライバシー保護技術を、実用的でデプロイ可能なインフラに効果的に統合する方法は何か?
  • RQ2プライバシー変換後の標準的でないイベントデータをサポートするためのアーキテクチャ的設計は何か?
  • RQ3さまざまなデータ変換において、プライバシー保護の変更を一貫して追跡・管理する方法は何か?
  • RQ4複数のプライバシー技術を組み合わせることの、データの有用性およびプロセスモデル品質への影響は何か?
  • RQ5ツールベースのアプローチは、実世界のプロセスマイニングのシナリオにおけるプライバシー保護手法の採用をどのように促進するか?

主な発見

  • インフラは、プロセスマイニングのための複数の最先端のプライバシー保護技術を、単一でアクセス可能なツールチェーンに効果的に統合した。
  • 標準的および変換済みイベントデータの両方をサポートしており、多様なデータシナリオにおける実用的デプロイメントを可能にしている。
  • 明示的なプライバシー用メタデータが効果的にキャプチャ・管理されており、データ変更の完全なプロバンス追跡が可能である。
  • 階層的使用モデルにより、個別から複合ワークフローまで、プライバシー技術の柔軟な適用が可能である。
  • 理論的なプライバシー解決策と運用上のプロセスマイニングツールのギャップを埋めるという点で、実世界へのデプロイの可能性と実用性が実証された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。