Skip to main content
QUICK REVIEW

[논문 리뷰] RapidProM: Mine Your Processes and Not Just Your Data

Wil M. P. van der Aalst, Alfredo Bolt|arXiv (Cornell University)|2017. 03. 10.
Business Process Modeling and Analysis참고 문헌 10인용 수 40
한 줄 요약

RapidProM은 이벤트 로그에서 프로세스 마이닝 기능을 확장하여 사용자가 프로세스 마이닝과 일반적인 데이터 마이닝 기법을 결합한 복잡한 분석 워크플로우를 설계하고 실행하며 재사용할 수 있도록 한다. 이는 프로세스 발견, 적합성 검사, 성능 분석을 지원하여 다양한 데이터셋과 도메인에서 프로세스 마이닝 실험의 재사용성과 자동화를 크게 향상시킨다.

ABSTRACT

The number of events recorded for operational processes is growing every year. This applies to all domains: from health care and e-government to production and maintenance. Event data are a valuable source of information for organizations that need to meet requirements related to compliance, efficiency, and customer service. Process mining helps to turn these data into real value: by discovering the real processes, by automatically identifying bottlenecks, by analyzing deviations and sources of non-compliance, by revealing the actual behavior of people, etc. Process mining is very different from conventional data mining and machine learning techniques. ProM is a powerful open-source process mining tool supporting hundreds of analysis techniques. However, ProM does not support analysis based on scientific workflows. RapidProM, an extension of RapidMiner based on ProM, combines the best of both worlds. Complex process mining workflows can be modeled and executed easily and subsequently reused for other data sets. Moreover, using RapidProM, one can benefit from combinations of process mining with other types of analysis available through the RapidMiner marketplace.

연구 동기 및 목표

  • 기존 데이터 마이닝 도구에서 이벤트 데이터의 프로세스 중심 분석에 대한 내장된 지원이 부족한 점을 보완한다.
  • 일반적인 데이터 마이닝 파이프라인과 통합되는 복잡하고 사용자 정의 가능한 프로세스 마이닝 워크플로우를 생성하고 재사용할 수 있도록 한다.
  • RapidMiner의 워크플로우 엔진과 ProM의 최신 프로세스 마이닝 알고리즘을 결합하여 전통적인 데이터 마이닝 도구와 프로세스 마이닝 간의 격차를 해소한다.
  • 연구자와 실무자가 준수성, 효율성, 성능 향상 측면에서 운영 프로세스를 체계적으로 분석할 수 있도록 지원한다.
  • 다양한 데이터셋과 파rameter 설정 구성에서 재현 가능하고 확장 가능한 프로세스 마이닝 실험을 촉진한다.

제안 방법

  • ProM의 프로세스 마이닝 알고리즘을 RapidMiner 플러그인으로 통합하여 RapidMiner의 시각적 워크플로우 환경을 활용한다.
  • 이벤트를 프로세스 인스턴스의 일부로 간주하는 전용 연산자(Operator)를 제공하여 프로세스 발견, 적합성 검사, 성능 분석을 수행한다.
  • RapidMiner의 시각적 인터페이스를 사용하여 반복 가능한 분석 워크플로우를 구축할 수 있도록 하며, 파rameter화된 실험을 위한 루프 및 서브프로세스를 지원한다.
  • 성능 지표(예: 대기 시간, 체류 시간)를 정규화된 프로세스 모델에 투영하여 시각적 및 통계적 분석을 가능하게 한다.
  • 처리 시간 또는 대기 시간과 같은 성능 임계값 기반으로 이벤트 로그의 필터링 및 상호작용 탐색을 허용한다.
  • RapidMiner 마켓플레이스를 통해 프로세스 마이닝을 다른 데이터 마이닝 기법과 결합하여 하이브리드 분석 워크플로우를 구현한다.

실험 결과

연구 질문

  • RQ1다양한 데이터셋과 프로세스 유형 간에 프로세스 마이닝 워크플로우를 효율적으로 설계하고 재사용할 수 있는 방법은 무엇인가?
  • RQ2일반 목적의 데이터 마이닝 플랫폼에 프로세스 마이닝을 얼마나 잘 통합할 수 있는가? 이는 종단 간 분석 파이프라인을 지원하는가?
  • RQ3워크플로우 기반의 프로세스 마이닝 접근 방식을 통해 실제 이벤트 로그에서 성능 저하 요인과 이탈 요인을 얼마나 효과적으로 식별할 수 있는가?
  • RQ4데이터 마이닝 도구와의 프로세스 마이닝 통합이 프로세스 분석의 확장성과 재현 가능성에 어떻게 기여하는가?
  • RQ5프로세스 중심 분석과 재사용 가능한 워크플로우의 조합이 전자 정부 및 헬스케어와 같은 도메인에서 더 실질적인 통찰을 이끌어낼 수 있는가?

주요 결과

  • ‘신용 회수를 위한 전송’ 활동의 평균 대기 시간은 17.61개월로 프로세스 내 주요 병목 현상을 시사한다.
  • ‘현지 정부로부터 결과 이의 제기 수신’ 활동의 평균 대기 시간은 5.06개월로 외부 의존성으로 인한 지연을 시사한다.
  • ‘벌금 추가’ 활동의 표준편차는 매우 낮아 30분으로, 이는 자동화된 프로세스일 가능성이 높음을 시사한다.
  • 지급의 평균 대기 시간은 1.92개월로 법적 2개월 기간에 가깝지만, 표준편차가 4.08개월로 매우 높아 일관되지 않은 시간 간격을 나타낸다.
  • 데이터셋에서 가장 오래 지속된 케이스는 114.57개월으로, 정확한 이벤트 로깅이 어려운 데이터 품질 문제를 드러낸다.
  • 성능 지표가 정규화된 프로세스 모델에 효과적으로 투영되어 활동별 성능에 대한 상호작용 가능한 필터링 및 색상 코드 기반 시각화가 가능해졌다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.