Skip to main content
QUICK REVIEW

[논문 리뷰] Practical Aspect of Privacy-Preserving Data Publishing in Process Mining

Majid Rafiei, Wil M. P. van der Aalst|arXiv (Cornell University)|2020. 01. 01.
Business Process Modeling and Analysis인용 수 3
한 줄 요약

이 논문은 프로세스 마이닝에 적용되는 최첨단 프라이버시 보존 기법을 구현하고 조율하는 파이썬 기반 웹 통합 인프라를 제시한다. 이 인프라는 표준 이벤트 데이터와 변환된 이벤트 데이터를 모두 지원하며, 명시적 메타데이터를 통해 프라이버시 보존 수정 사항을 추적하고, 데이터 유용성과 기밀성의 균형을 맞추기 위해 단일 또는 복합 기법을 영리하게 배치할 수 있도록 한다.

ABSTRACT

Process mining techniques such as process discovery and conformance checking provide insights into actual processes by analyzing event data that are widely available in information systems. These data are very valuable, but often contain sensitive information, and process analysts need to balance confidentiality and utility. Privacy issues in process mining are recently receiving more attention from researchers which should be complemented by a tool to integrate the solutions and make them available in the real world. In this paper, we introduce a Python-based infrastructure implementing state-of-the-art privacy preservation techniques in process mining. The infrastructure provides a hierarchy of usages from single techniques to the collection of techniques, integrated as web-based tools. Our infrastructure manages both standard and non-standard event data resulting from privacy preservation techniques. It also stores explicit privacy metadata to track the modifications applied to protect sensitive data.

연구 동기 및 목표

  • 실제 프로세스 마이닝 응용 분야에 있어서 프라이버시 보존 기법의 실용적 통합이 증가하는 수요를 충족시키기 위해.
  • 이론적 프라이버시 솔루션과 운영 배포 간 격차를 해소하기 위해 구현 가능한 도구 기반 인프라를 제공함으로써.
  • 프로세스 마이닝에서 프라이버시 변환으로 인해 발생하는 표준이 아닌 이벤트 데이터를 모두 관리하기 위해.
  • 명시적 프라이버시 메타데이터를 통해 프라이버시 보존 수정 사항의 추적을 가능하게 하기 위해.
  • 통합 프레임워크 내에서 개별 또는 복합 프라이버시 기법을 영리하게 사용할 수 있도록 지원하기 위해.

제안 방법

  • 다양한 프라이버시 보존 기법을 위한 모듈러 컴포넌트를 갖춘 파이썬 기반 시스템으로 구현된 인프라.
  • 프로세스 마이닝을 위한 단일 상호운용 가능한 프레임워크에 여러 최첨단 프라이버시 기법을 통합함.
  • 표준 이벤트 데이터와 프라이버시 보존 변환에 의해 수정된 데이터를 모두 지원하는 시스템.
  • 이벤트 데이터에 적용된 모든 수정 사항을 기록하기 위해 명시적 프라이버시 메타데이터를 저장하고 관리함.
  • 프로세스 분석가들이 접근하고 실용적으로 사용할 수 있도록 웹 기반 도구로 노출된 인프라.
  • 단일 기법에서 다중 기법의 복합 워크플로우에 이르기까지의 계층적 사용 모델을 제공함.

실험 결과

연구 질문

  • RQ1프로세스 마이닝에서 프라이버시 보존 기법을 효과적으로 실용적이고 구현 가능한 인프라에 통합할 수 있는 방법은 무엇인가?
  • RQ2프라이버시 변환 후 표준 및 비표준 이벤트 데이터를 모두 지원할 수 있는 아키텍처 설계는 무엇인가?
  • RQ3다양한 데이터 변환 간에 프라이버시 보존 수정 사항을 일관되게 추적하고 관리할 수 있는 방법은 무엇인가?
  • RQ4다양한 프라이버시 기법을 병합할 경우 데이터 유용성과 프로세스 모델 품질에 미치는 영향은 무엇인가?
  • RQ5도구 기반 접근 방식은 실제 프로세스 마이닝 시나리오에서 프라이버시 보존 방법의 도입을 어떻게 향상시킬 수 있는가?

주요 결과

  • 인프라는 프로세스 마이닝을 위한 다수의 최첨단 프라이버시 보존 기법을 하나의 접근하기 쉬운 도구 체인으로 성공적으로 통합하였다.
  • 표준 및 변환된 이벤트 데이터를 모두 지원하여 다양한 데이터 시나리오에서 실용적인 배포가 가능하다.
  • 명시적 프라이버시 메타데이터가 효과적으로 캡처되고 관리되어 데이터 수정 사항의 완전한 기원 추적을 가능하게 한다.
  • 계층적 사용 모델은 프라이버시 기법의 영리한 적용을 가능하게 하며, 고립된 기법에서 복합 워크플로우에 이르기까지 다양한 수준을 커버한다.
  • 이론적 프라이버시 솔루션과 운영 프로세스 마이닝 도구 사이의 격차를 메우며, 실제 배포의 가능성과 실용성을 입증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.