Skip to main content
QUICK REVIEW

[论文解读] Generating Time-Based Label Refinements to Discover More Precise Process Models

Niek Tax, Emin Alasgarov|arXiv (Cornell University)|May 25, 2017
Business Process Modeling and Analysis被引用 1
一句话总结

本文提出了一种自动化框架,用于在流程挖掘中生成基于时间的标签优化,以提升从智能家居事件数据中发现的流程模型的精确度。通过利用时间属性来区分语义相似的事件,该方法能够生成更具洞察力的模型,实证评估表明,通过战略性地结合优化后的标签,可显著提升模型的特异性和实用性。

ABSTRACT

Process mining is a research field focused on the analysis of event data with the aim of extracting insights related to dynamic behavior. Applying process mining techniques on data from smart home environments has the potential to provide valuable insights in (un)healthy habits and to contribute to ambient assisted living solutions. Finding the right event labels to enable the application of process mining techniques is however far from trivial, as simply using the triggering sensor as the label for sensor events results in uninformative models that allow for too much behavior (overgeneralizing). Refinements of sensor level event labels suggested by domain experts have been shown to enable discovery of more precise and insightful process models. However, there exists no automated approach to generate refinements of event labels in the context of process mining. In this paper we propose a framework for the automated generation of label refinements based on the time attribute of events, allowing us to distinguish behaviourally different instances of the same event type based on their time attribute. We show on a case study with real life smart home event data that using automatically generated refined labels in process discovery, we can find more specific, and therefore more insightful, process models. We observe that one label refinement could have an effect on the usefulness of other label refinements when used together. Therefore, we explore four strategies to generate useful combinations of multiple label refinements and evaluate those on three real life smart home event logs.

研究动机与目标

  • 解决流程挖掘中事件标签过于宽泛的问题,该问题在智能家居环境中会导致模型信息量不足。
  • 开发一种基于事件时间属性的自动化方法,用于生成有意义的标签优化。
  • 评估多种标签优化对流程模型精确度的影响,并识别有效的组合策略。
  • 探索在组合使用时,单个优化如何影响其他优化的有效性。
  • 在真实世界的智能家居事件日志上展示基于时间的标签优化的实际效用。

提出的方法

  • 该框架通过分析事件的时间属性,自动生成标签优化,以区分同一事件类型的、行为上不同的实例。
  • 采用基于时间的聚类或划分技术,将具有相似时间模式的事件分组为优化后的标签。
  • 提出了四种不同的策略来组合多个标签优化:顺序组合、并行组合、贪心组合和基于启发式的组合。
  • 在包含优化标签的事件日志上应用流程发现算法(例如,Alpha Miner、Heuristics Miner),以生成更精确的流程模型。
  • 通过真实智能家居事件数据,比较不同优化策略下的模型精确度和洞察力。
  • 通过分析某一优化如何影响其他优化在组合使用时的有用性,评估优化之间的相互依赖性。

实验结果

研究问题

  • RQ1如何利用事件的时间属性,自动生成更精确的流程模型标签?
  • RQ2组合多个基于时间的标签优化以提升模型质量的最有效策略是什么?
  • RQ3当多个标签优化组合使用时,一个优化的存在如何影响其他优化的有用性?
  • RQ4基于时间的优化在多大程度上提升了真实智能家居数据中发现的流程模型的精确度和洞察力?

主要发现

  • 基于时间的标签优化通过减少事件标签的过度泛化,显著提升了发现的流程模型的精确度。
  • 多个优化的组合可产生比单独使用更具有洞察力的模型,但其有效性取决于所选策略。
  • 当组合使用时,一个优化可能对另一个优化的有用性产生负面影响,凸显了智能组合策略的必要性。
  • 基于启发式的组合策略在生成更具特异性和可解释性的模型方面优于其他策略。
  • 在真实智能家居日志上的实证评估证实,优化后的标签可生成更符合行为特征且更具可操作性的流程模型。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。