Skip to main content
QUICK REVIEW

[论文解读] A Python Extension to Simulate Petri nets in Process Mining

Mahsa Pourbafrani, Sandhya Vasudevan|arXiv (Cornell University)|Jan 1, 2021
Business Process Modeling and Analysis参考文献 11被引用 4
一句话总结

本文提出了一种基于 Python 的开源扩展,用于 PM4Py,通过离散事件仿真(DES)自动从真实流程事件日志生成模拟事件日志。通过提取流程模型(Petri 网)和性能数据(持续时间、到达率),该工具支持用户定义参数的“假设”分析,生成保留原始流程流动与时间行为的逼真、带时间戳的事件日志。

ABSTRACT

The capability of process mining techniques in providing extensive knowledge and insights into business processes has been widely acknowledged. Process mining techniques support discovering process models as well as analyzing process performance and bottlenecks in the past executions of processes. However, process mining tends to be "backward-looking" rather than "forward-looking" techniques like simulation. For example, process improvement also requires "what-if" analyses. In this paper, we present a Python library that uses an event log to directly generate a simulated event log, with additional options for end-users to specify the duration of activities and the arrival rate. Since the generated simulation model is supported by historical data (event data)and it is based on the Discrete Event Simulation (DES) technique, the generated event data is similar to the behavior of the real process.

研究动机与目标

  • 解决现有流程挖掘工具缺乏前瞻性仿真能力的问题。
  • 在无需深入仿真专业知识的情况下,实现自动化、数据驱动的业务流程仿真。
  • 生成保留真实流程数据中活动流与时间特征的逼真模拟事件日志。
  • 通过允许用户调整活动持续时间和到达率,支持灵活的“假设”情景分析。

提出的方法

  • 该工具从原始事件日志开始,应用流程挖掘以发现 Petri 网模型。
  • 通过统计分析和分布拟合,从事件日志中提取活动持续时间和到达率。
  • 使用 Python 中的离散事件仿真(DES)引擎(SimPy)基于 Petri 网和用户定义参数模拟流程执行。
  • 仿真过程跟踪案例在活动中的推进,包括在容量限制达到时的排队行为。
  • 将仿真时钟转换为真实时间戳,并将事件捕获为新的事件日志格式。
  • 最终输出为包含案例 ID、活动和时间戳属性的模拟事件日志,适用于进一步的流程挖掘分析。

实验结果

研究问题

  • RQ1流程挖掘工具能否在无需手动建模的情况下,仅基于真实事件日志自动生成模拟事件日志?
  • RQ2仅使用历史数据和用户定义参数,模拟事件日志在多大程度上能准确再现原始流程的时间和流程行为?
  • RQ3用户定义参数(如活动持续时间和到达率)在多大程度上影响模拟事件日志的真实性与实用性?
  • RQ4模拟事件日志能否用于高保真度地重新发现原始流程模型,从而验证仿真的有效性?

主要发现

  • 该工具成功生成了保留原始流程结构和时间特征的模拟事件日志,经验证,从模拟日志中可重新发现相同的 Petri 网模型。
  • 由于容量限制,模拟事件日志中包含了逼真的排队行为,隐含地反映了现实世界中的瓶颈。
  • 通过允许用户修改活动持续时间和到达率,该工具支持灵活的“假设”分析,便于基于情景的性能评估。
  • 模拟日志与标准流程挖掘工具兼容,原始日志与模拟日志之间的模型发现结果一致,验证了其兼容性。
  • 该工具为开源,已在学术使用案例中得到验证,显示出在多样化仿真场景下的稳健性与可用性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。