Skip to main content
QUICK REVIEW

[논문 리뷰] Generating Time-Based Label Refinements to Discover More Precise Process Models

Niek Tax, Emin Alasgarov|arXiv (Cornell University)|2017. 05. 25.
Business Process Modeling and Analysis인용 수 1
한 줄 요약

이 논문은 스마트 홈 이벤트 데이터에서 발견된 프로세스 모델의 정밀도를 향상시키기 위해 시간 기반 레이블 정제를 자동으로 생성하는 프레임워크를 제안한다. 의미적으로 유사한 이벤트를 구분하기 위해 시간적 특성을 활용함으로써, 더 통찰력 있는 모델을 가능하게 하며, 실증적 평가 결과 전략적으로 조합할 경우 레이블 정제가 모델의 특정성과 유용성을 크게 향상시킴을 보여준다.

ABSTRACT

Process mining is a research field focused on the analysis of event data with the aim of extracting insights related to dynamic behavior. Applying process mining techniques on data from smart home environments has the potential to provide valuable insights in (un)healthy habits and to contribute to ambient assisted living solutions. Finding the right event labels to enable the application of process mining techniques is however far from trivial, as simply using the triggering sensor as the label for sensor events results in uninformative models that allow for too much behavior (overgeneralizing). Refinements of sensor level event labels suggested by domain experts have been shown to enable discovery of more precise and insightful process models. However, there exists no automated approach to generate refinements of event labels in the context of process mining. In this paper we propose a framework for the automated generation of label refinements based on the time attribute of events, allowing us to distinguish behaviourally different instances of the same event type based on their time attribute. We show on a case study with real life smart home event data that using automatically generated refined labels in process discovery, we can find more specific, and therefore more insightful, process models. We observe that one label refinement could have an effect on the usefulness of other label refinements when used together. Therefore, we explore four strategies to generate useful combinations of multiple label refinements and evaluate those on three real life smart home event logs.

연구 동기 및 목표

  • 스마트 홈 환경에서 너무 일반적인 이벤트 레이블로 인해 정보가 부족한 모델이 생성되는 문제를 해결하기 위해.
  • 이벤트의 시간적 특성을 활용하여 의미 있는 레이블 정제를 자동으로 생성하는 방법을 개발하기 위해.
  • 다중 레이블 정제가 프로세스 모델 정밀도에 미치는 영향을 평가하고 효과적인 조합 전략을 규명하기 위해.
  • 다양한 레이블 정제를 조합할 때 각각의 정제가 상호 영향을 미치는 방식을 탐색하기 위해.
  • 실제 스마트 홈 이벤트 로그를 대상으로 시간 기반 레이블 정제의 실용적 유용성을 입증하기 위해.

제안 방법

  • 프레임워크는 이벤트의 시간적 특성 분석을 통해 동일한 이벤트 유형이지만 행동적으로 구별 가능한 사례를 식별함으로써 자동으로 레이블 정제를 생성한다.
  • 시간 기반 클러스터링 또는 분할 기법을 적용하여 유사한 시간 패턴을 가진 이벤트들을 정제된 레이블로 그룹화한다.
  • 다중 레이블 정제를 조합하기 위한 네 가지 다른 전략이 제안된다: 순차적, 병렬, 근사적, 히우리스틱 기반 조합.
  • 정제된 레이블이 포함된 이벤트 로그를 바탕으로 프로세스 발견 알고리즘(예: 알파 마이너, 히우리스틱스 마이너)을 적용하여 더 정밀한 프로세스 모델을 생성한다.
  • 실제 스마트 홈 이벤트 데이터를 사용하여 다양한 정제 전략 간의 모델 정밀도와 통찰력 수준을 비교 평가한다.
  • 레이블 정제 간 상호의존성을 분석하여, 한 정제가 다른 정제의 유용성에 미치는 영향을 평가한다.

실험 결과

연구 질문

  • RQ1이벤트의 시간적 특성을 어떻게 활용하여 더 정밀한 프로세스 모델 레이블을 자동으로 생성할 수 있는가?
  • RQ2다중 시간 기반 레이블 정제를 조합하는 데 가장 효과적인 전략은 무엇인가?
  • RQ3여러 레이블 정제를 함께 사용할 때 한 정제가 다른 정제의 유용성에 미치는 영향은 어떠한가?
  • RQ4시간 기반 정제가 실제 스마트 홈 데이터에서 발견된 프로세스 모델의 정밀도와 통찰력에 얼마나 기여하는가?

주요 결과

  • 시간 기반 레이블 정제는 이벤트 레이블의 과도한 일반화를 줄임으로써 발견된 프로세스 모델의 정밀도를 크게 향상시킨다.
  • 다중 정제의 조합은 개별 정제만을 사용할 때보다 더 통찰력 있는 모델을 생성할 수 있지만, 그 효과는 선택된 전략에 따라 달라진다.
  • 한 정제가 다른 정제와 조합될 경우 부정적인 영향을 미칠 수 있으며, 이는 지능적인 조합 전략이 필요함을 시사한다.
  • 히우리스틱 기반 조합 전략이 다른 전략들보다 더 높은 특정성과 해석 가능성으로 모델을 생성하는 데 뛰어난 성능을 보였다.
  • 실제 스마트 홈 로그를 대상으로 한 실증적 평가 결과, 정제된 레이블은 더 행동적으로 정확하고 실행 가능한 프로세스 모델을 생성함을 확인하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.