Skip to main content
QUICK REVIEW

[论文解读] A Python Tool for Object-Centric Process Mining Comparison

Anahita Farhang Ghahfarokhi, Wil M. P. van der Aalst|arXiv (Cornell University)|Jan 1, 2022
Business Process Modeling and Analysis被引用 2
一句话总结

本论文提出OCPC,一个基于PM4PY-MDL框架的独立Python工具,通过流程立方体实现对面向对象流程的交互式比较。该工具支持面向对象事件日志(OCEL)的多维切片/钻取操作,采用可定制的物化策略(如“存在”或“全部”对象条件),支持分区OCEL的导出,并促进对面向对象流程模型(如直接后继图和面向对象Petri网)的发现与并排比较。

ABSTRACT

Object-centric process mining provides a more holistic view of processes where we analyze processes with multiple case notions. However, most object-centric process mining techniques consider the whole event log rather than the comparison of existing behaviors in the log. In this paper, we introduce a stand-alone object-centric process cube tool built on the PM4PY-MDL process mining framework. Our infrastructure uses both object and event attributes to build the process cube which leads to different types of materialization. Furthermore, our tool is equipped with the state of the art object-centric process mining techniques. Through our tool the user can visualize the extracted object-centric event log from process cube operations, export the object-centric event log, discover the state-of-the-art object-centric process model for the extracted log, and compare the process models side-by-side.

研究动机与目标

  • 为解决缺乏支持多种案例概念的面向对象流程对比分析工具的问题。
  • 使用户能够通过类似OLAP的流程立方体操作(如切片和钻取)探索OCEL。
  • 支持从提取的OCEL子集中发现并并排比较面向对象流程模型(如OC-DFG、OC-Petri网)。
  • 提供灵活的物化策略(如“存在”、“全部”),基于对象和事件属性定义有意义的流程立方体单元。
  • 通过导出分区OCEL及性能/频率标注的模型对比,增强对流程的理解。

提出的方法

  • 该工具使用Tkinter GUI实现,并与PM4PY-MDL框架集成以执行流程挖掘操作。
  • 输入为JSON-OCEL或XML-OCEL,事件及其关联的对象和属性分别存储在独立的表中。
  • 用户定义维度(事件和对象属性)以构建流程立方体,支持切片和钻取操作。
  • 物化策略包括“存在”(至少一个对象满足条件)和“全部”(所有对象均满足条件),实现事件集的语义过滤。
  • 该工具基于选定的立方体单元提取OCEL子集,并使用前沿技术发现面向对象流程模型。
  • 支持流程模型和事件日志的并排比较,提供可视化与性能指标以供分析。

实验结果

研究问题

  • RQ1如何通过使用流程立方体实现对OCEL的交互式多维探索,来增强面向对象流程挖掘?
  • RQ2在面向对象分析中,定义有意义的流程立方体单元时,最有效的物化策略是什么?
  • RQ3该工具如何支持从分区OCEL中发现并比较面向对象流程模型?
  • RQ4在事件数量、事件属性和对象属性方面,该工具的可扩展性如何?
  • RQ5如何利用流程立方体操作识别并分析面向对象流程行为中的差异?

主要发现

  • 该工具成功通过流程立方体操作支持OCEL的交互式探索,其基于Tkinter的响应式GUI表现良好。
  • 物化策略(“存在”与“全部”)使用户能够基于对象存在性或条件完全满足性,定义语义上合理的流程立方体单元。
  • 构建立方体的时间随事件数量线性增长(如20,000个事件耗时490.12秒),并随对象属性数量非线性增长(如4个对象属性耗时490.12秒)。
  • 该工具在中等规模OCEL上表现出合理的可扩展性,20,000个事件和4个对象属性的立方体构建时间低于8分钟。
  • 系统支持分区OCEL的导出,并可并排比较已发现的面向对象模型,包括性能与频率指标。
  • 该工具在面向对象流程的对比分析方面展示了可行性,未来具备实现切片/钻取选择自动化的潜力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。