Skip to main content
QUICK REVIEW

[论文解读] Clustering Object-Centric Event Logs

Anahita Farhang Ghahfarokhi, Fatemeh Akoochekian|arXiv (Cornell University)|Jan 1, 2022
Business Process Modeling and Analysis被引用 1
一句话总结

本文提出一种基于聚类的方法,通过在面向对象事件日志(OCEL)中对相似对象进行分组,简化复杂的面向对象过程模型。该方法引入两种事件分配策略——'existence'(存在)与'all'(全部)——以避免聚类过程中的重复或遗漏,从而在保持模型拟合度的同时,降低复杂度,生成更简洁、更易理解的过程模型。

ABSTRACT

Process mining provides various algorithms to analyze process executions based on event data. Process discovery, the most prominent category of process mining techniques, aims to discover process models from event logs, however, it leads to spaghetti models when working with real-life data. Therefore, several clustering techniques have been proposed on top of traditional event logs (i.e., event logs with a single case notion) to reduce the complexity of process models and discover homogeneous subsets of cases. Nevertheless, in real-life processes, particularly in the context of Business-to-Business (B2B) processes, multiple objects are involved in a process. Recently, Object-Centric Event Logs (OCELs) have been introduced to capture the information of such processes, and several process discovery techniques have been developed on top of OCELs. Yet, the output of the proposed discovery techniques on real OCELs leads to more informative but also more complex models. In this paper, we propose a clustering-based approach to cluster similar objects in OCELs to simplify the obtained process models. Using a case study of a real B2B process, we demonstrate that our approach reduces the complexity of the process models and generates coherent subsets of objects which help the end-users gain insights into the process.

研究动机与目标

  • 为解决源自涉及多个交互对象的实际企业对企业(B2B)流程的复杂过程模型问题。
  • 通过在OCEL中对相似对象进行聚类,降低面向对象过程挖掘(OCPM)中的模型复杂度。
  • 通过生成对象的同质子集及相应简化的过程模型,使最终用户能够获得更清晰的洞察。
  • 提出并评估两种事件分配策略——'existence'与'all'——以处理聚类过程中OCEL的收敛问题。

提出的方法

  • 从涉及订单、批次和客户的实际B2B制造流程中提取OCEL。
  • 通过基于图的属性(如中心性度量)增强OCEL,以提升聚类质量。
  • 选择目标对象类型(如批次)进行聚类,并应用凝聚聚类与k-means聚类算法。
  • 提出两种事件分配策略:'existence'(若聚类中至少一个对象具有该事件,则分配)与'all'(仅当该事件的所有对象均在聚类中时才分配)。
  • 从聚类中生成子OCEL,并应用过程发现(OC-DFG)以推导出简化且可解释的过程模型。
  • 引入复杂度度量以评估所得OC-DFG模型的质量。

实验结果

研究问题

  • RQ1在不牺牲模型拟合度的前提下,OCEL中对象聚类如何降低发现过程模型的复杂度?
  • RQ2在基于聚类的OCEL简化中,'existence'与'all'事件分配策略之间的权衡是什么?
  • RQ3在真实B2B制造流程中,对OCEL中的相似对象进行聚类是否能揭示有意义且连贯的子过程?
  • RQ4基于图的增强方法(如中心性)如何提升OCEL中对象聚类的质量?
  • RQ5所提出的方法在多大程度上能生成简化、可解释且能区分不同过程变体的过程模型?

主要发现

  • 所提出的聚类方法成功降低了初始OC-DFG模型的复杂度,同时保持了相近的拟合度水平。
  • 'all'策略避免了事件重复,但存在因对象分布在多个聚类中而丢失事件的风险;而'existence'策略虽保留了所有事件,但可能导致事件重复。
  • 使用如中心性等基于图的增强方法提升了聚类质量,有助于捕捉对象在流程中的结构角色。
  • 最终的聚类模型揭示了不同的过程变体——如针对不同物料类型的不同处理流程——表明该方法能够有效分离出有意义的子过程。
  • 在真实B2B制造流程上的案例研究表明,该方法能够生成简化、连贯且可解释的过程模型,有助于用户理解复杂的工作流程。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。