Skip to main content
QUICK REVIEW

[论文解读] Defining Cases and Variants for Object-Centric Event Data

Jan Niklas Adams, Daniel Schuster|arXiv (Cornell University)|Jan 1, 2022
Business Process Modeling and Analysis被引用 1
一句话总结

本文提出将流程执行(process executions)作为传统案例(cases)的图结构泛化形式,适用于与多个对象类型关联的物件中心事件数据。通过提取连通子图并利用图同构识别等效流程行为,作者定义了物件中心变体(object-centric variants),并提出一种可扩展的布局算法,用于在真实日志中可视化这些变体。

ABSTRACT

The execution of processes leaves traces of event data in information systems. These event data can be analyzed through process mining techniques. For traditional process mining techniques, one has to associate each event with exactly one object, e.g., the company's customer. Events related to one object form an event sequence called a case. A case describes an end-to-end run through a process. The cases contained in event data can be used to discover a process model, detect frequent bottlenecks, or learn predictive models. However, events encountered in real-life information systems, e.g., ERP systems, can often be associated with multiple objects. The traditional sequential case concept falls short of these object-centric event data as these data exhibit a graph structure. One might force object-centric event data into the traditional case concept by flattening it. However, flattening manipulates the data and removes information. Therefore, a concept analogous to the case concept of traditional event logs is necessary to enable the application of different process mining tasks on object-centric event data. In this paper, we introduce the case concept for object-centric process mining: process executions. These are graph-based generalizations of cases as considered in traditional process mining. Furthermore, we provide techniques to extract process executions. Based on these executions, we determine equivalent process behavior with respect to an attribute using graph isomorphism. Equivalent process executions with respect to the event's activity are object-centric variants, i.e., a generalization of variants in traditional process mining. We provide a visualization technique for object-centric variants. The contribution's scalability and efficiency are extensively evaluated. Furthermore, we provide a case study showing the most frequent object-centric variants of a real-life event log.

研究动机与目标

  • 解决传统工作流程挖掘的局限性,即假设每个事件仅属于单一对象(案例),通过将案例概念扩展至与多个对象类型关联的物件中心事件数据。
  • 克服将物件中心日志扁平化为传统事件日志所导致的信息丢失与结构失真问题。
  • 开发一种方法,从图结构物件中心事件数据中提取有意义的、端到端的流程行为单元(称为流程执行)。
  • 基于图同构定义物件中心变体为流程执行的等价类,实现对跨多种对象类型的重复流程模式的分析。
  • 提供一种可扩展的布局算法,以可视化物件中心变体,支持从业者直观理解。

提出的方法

  • 将流程执行定义为物件图的连通子图,其中每个子图代表跨相互依赖对象的一致性事件序列。
  • 采用两种提取技术——连通分量法与主导类型应用法——从物件中心事件图中识别并提取流程执行。
  • 应用图同构算法比较流程执行,并根据结构与活动相似性将其分组为等价类。
  • 将物件中心变体定义为这些等价类,将传统工作流程挖掘中的变体概念泛化至异构、多对象流程。
  • 设计一种布局算法,通过以人类可读的图形式排列对象与事件,实现物件中心变体的可视化。
  • 通过在真实与合成日志上的性能测量评估可扩展性,衡量执行时间与事件数量及每类变体中对象数量的关系。

实验结果

研究问题

  • RQ1如何将传统工作流程挖掘中的案例概念泛化,以处理事件与多个对象关联的物件中心事件数据?
  • RQ2如何有效且无损地从图结构物件中心事件日志中提取端到端的流程行为单元(类比于案例)?
  • RQ3如何在物件中心数据中识别等效流程行为?何种标准可确保此类行为在语义与结构上的一致性?
  • RQ4何种可扩展且直观的可视化技术可用于物件中心变体,以支持从业者理解复杂多对象流程模式?
  • RQ5所提出方法在事件数量与每类变体中对象数量增加时,其可扩展性如何?

主要发现

  • 所提出的流程执行提取技术——连通分量法与主导类型应用法——成功从物件中心事件图中提取出有意义且一致的流程行为单元。
  • 基于图同构的等价性检查可准确识别物件中心变体,在贷款申请案例研究中,11%的流程执行属于最频繁的变体。
  • 布局算法具有高效可扩展性,运行时间随事件数量与每类等价类中对象数量的增加而可预测地增长,展现出实际可行性。
  • 在真实贷款申请流程的案例研究中,识别出五个不同的物件中心变体,包括涉及多个报价及取消/接受序列的频繁模式。
  • 物件中心变体的可视化提供了对并发性与对象交互模式的直观、可操作的洞察,例如报价创建时机与客户沟通的时间关系。
  • 与扁平化方法相比,本方法通过保留结构与语义信息,实现了更准确、更有意义的工作流程挖掘,适用于真实ERP与制造系统数据。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。