[论文解读] Practical Aspect of Privacy-Preserving Data Publishing in Process Mining
本文提出了一种基于 Python 的、与网络集成的基础设施,实现了并编排了最先进的隐私保护技术,用于流程挖掘。该系统支持标准事件数据和转换后的事件数据,通过显式元数据追踪隐私保护的修改,并可灵活地部署单一或组合技术,以在数据可用性和机密性之间取得平衡。
Process mining techniques such as process discovery and conformance checking provide insights into actual processes by analyzing event data that are widely available in information systems. These data are very valuable, but often contain sensitive information, and process analysts need to balance confidentiality and utility. Privacy issues in process mining are recently receiving more attention from researchers which should be complemented by a tool to integrate the solutions and make them available in the real world. In this paper, we introduce a Python-based infrastructure implementing state-of-the-art privacy preservation techniques in process mining. The infrastructure provides a hierarchy of usages from single techniques to the collection of techniques, integrated as web-based tools. Our infrastructure manages both standard and non-standard event data resulting from privacy preservation techniques. It also stores explicit privacy metadata to track the modifications applied to protect sensitive data.
研究动机与目标
- 为解决在实际流程挖掘应用中对隐私保护技术进行实用化集成的日益增长的需求。
- 通过提供可部署的、基于工具的基础设施,弥合理论隐私解决方案与实际部署之间的差距。
- 管理因流程挖掘中的隐私转换而产生的标准和非标准事件数据。
- 通过显式隐私元数据实现对隐私保护修改的追踪。
- 在统一框架中支持对单一或组合隐私技术的灵活使用。
提出的方法
- 该基础设施作为基于 Python 的系统实现,其模块化组件支持各种隐私保护技术。
- 将多种最先进的隐私保护技术整合到一个统一的、可互操作的流程挖掘框架中。
- 该系统支持标准事件数据以及经隐私保护转换处理后的数据。
- 它存储并管理显式的隐私元数据,以记录对事件数据所应用的所有修改。
- 该基础设施通过基于网络的工具暴露,以实现流程分析师的便捷和实用使用。
- 它提供分层使用模型,从单一技术到多个技术的复合工作流。
实验结果
研究问题
- RQ1如何能有效将流程挖掘中的隐私保护技术集成到一个实用且可部署的基础设施中?
- RQ2什么样的架构设计能够支持在隐私转换后仍支持标准和非标准事件数据?
- RQ3如何在不同的数据转换中一致地追踪和管理隐私保护的修改?
- RQ4组合多种隐私技术对数据可用性和流程模型质量有何影响?
- RQ5基于工具的方法如何提升隐私保护方法在实际流程挖掘场景中的采纳率?
主要发现
- 该基础设施成功地将多种最先进的隐私保护技术整合到一个统一、可访问的工具链中,用于流程挖掘。
- 它支持标准和转换后的事件数据,实现了在多样化数据场景下的实际部署。
- 显式的隐私元数据被有效捕获和管理,从而实现了对数据修改的完整溯源追踪。
- 分层使用模型使得隐私技术的应用具有灵活性,既可单独使用,也可组成复合工作流。
- 该系统通过弥合理论隐私解决方案与实际流程挖掘工具之间的差距,展示了在现实世界中部署的可行性与实用性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。