Skip to main content
QUICK REVIEW

[论文解读] PROVED: A Tool for Graph Representation and Analysis of Uncertain Event Data

Marco Pegoraro, Merih Seran Uysal|arXiv (Cornell University)|Mar 9, 2021
Business Process Modeling and Analysis参考文献 13被引用 2
一句话总结

PROVED 是一个基于 Python 的工具,通过将不确定的轨迹建模为具有形式语义的行为图和 Petri 网,实现对不确定事件数据的流程挖掘。它支持发现、符合性检查以及偏差评分的上下界计算,从而在不丢弃不确定数据的前提下,分析所有可能的执行场景。

ABSTRACT

The discipline of process mining aims to study processes in a data-driven manner by analyzing historical process executions, often employing Petri nets. Event data, extracted from information systems (e.g. SAP), serve as the starting point for process mining. Recently, novel types of event data have gathered interest among the process mining community, including uncertain event data. Uncertain events, process traces and logs contain attributes that are characterized by quantified imprecisions, e.g., a set of possible attribute values. The PROVED tool helps to explore, navigate and analyze such uncertain event data by abstracting the uncertain information using behavior graphs and nets, which have Petri nets semantics. Based on these constructs, the tool enables discovery and conformance checking.

研究动机与目标

  • 应对流程挖掘工具在处理不确定事件数据方面日益增长的需求,其中活动标签等属性存在不精确或多重可能值的情况。
  • 克服现有工具仅丢弃或忽略不确定数据的局限性,将不确定性作为第一类信息进行保留与分析。
  • 通过将不确定的流程轨迹建模为具有可执行语义的行为图和 Petri 网,实现对不确定流程轨迹的正式分析。
  • 通过计算最佳情况与最差情况的对齐成本,支持不确定轨迹与规范模型之间的符合性检查。
  • 提供交互式、无需编码的界面,通过可视化支持对不确定日志、变体、轨迹及事件级别不确定性的探索。

提出的方法

  • 使用扩展的 XES 格式表示不确定事件数据,通过元属性表示不确定性,例如可能活动标签的集合。
  • 将每个不确定轨迹建模为行为图,以捕捉具有不确定属性的事件之间所有可能的前后序关系。
  • 将行为图转换为行为网(Petri 网),以支持正式的执行语义和基于模型的分析。
  • 使用对齐算法计算不确定轨迹(作为行为网)与规范模型(作为 Petri 网)之间的符合性评分。
  • 提供双重对齐结果:一个用于最佳情况(最低成本),一个用于最差情况(最高成本),以反映不确定性边界。
  • 实现基于 Web 的交互式仪表板,用于可视化不确定变体、单个轨迹、带有时间区间的甘特图,以及支持不确定性的 Petri 网表示。

实验结果

研究问题

  • RQ1如何在流程挖掘中正式表示并分析不确定事件数据——其中活动标签或其他属性存在不精确或多重取值的情况?
  • RQ2如何有效建模具有可执行语义的不确定流程轨迹,以反映该流程所有可能的实现?
  • RQ3如何调整符合性检查以处理事件数据中的不确定性,同时提供与规范模型偏差的上下界?
  • RQ4哪些用户界面模式最能支持无需编程的不确定流程数据交互式探索?
  • RQ5行为图与 Petri 网能否有效结合,以实现对不确定流程行为的可扩展且精确的分析?

主要发现

  • PROVED 通过将不确定轨迹转换为行为图和 Petri 网,成功实现了对不确定事件数据的建模,支持正式执行与分析。
  • 该工具计算了不确定轨迹与规范模型之间的最佳情况与最差情况对齐成本,其中表 1 中示例轨迹的最差情况成本为 2。
  • 行为网表示支持所有可能的不确定轨迹实现的执行,同时保留了并发性、选择性和跳过行为。
  • 交互式仪表板使用户能够探索不确定变体、深入查看单个轨迹,并通过甘特图和表格视图可视化不确定性。
  • 该工具支持完整的 XES 导入/导出,并带有支持不确定性的元数据,可无缝集成到现有流程挖掘工作流中。
  • 双重对齐方法通过展示可能的符合性偏差范围,提供了诊断洞察,增强了在不确定流程分析中的透明度。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。