Skip to main content
QUICK REVIEW

[论文解读] Machine Learning for Anomaly Detection in Particle Physics

Vasilis Belis, Patrick Odagiu|arXiv (Cornell University)|Dec 20, 2023
Particle physics theoretical and experimental studies参考文献 180被引用 3
一句话总结

本文综述了高能物理领域中用于异常检测的机器学习技术,重点聚焦于无需预先假设信号模型的模型无关方法,以识别已知背景之外的偏离。文章系统回顾了弱监督、无监督及自监督方法在新物理搜索、实时触发、探测器监控以及新兴的量子机器学习应用中的使用,强调了在真实高能物理(HEP)应用场景中验证与鲁棒性方面面临的关键挑战。

ABSTRACT

The detection of out-of-distribution data points is a common task in particle physics. It is used for monitoring complex particle detectors or for identifying rare and unexpected events that may be indicative of new phenomena or physics beyond the Standard Model. Recent advances in Machine Learning for anomaly detection have encouraged the utilization of such techniques on particle physics problems. This review article provides an overview of the state-of-the-art techniques for anomaly detection in particle physics using machine learning. We discuss the challenges associated with anomaly detection in large and complex data sets, such as those produced by high-energy particle colliders, and highlight some of the successful applications of anomaly detection in particle physics experiments.

研究动机与目标

  • 提供高能物理(HEP)实验中前沿机器学习异常检测技术的全面概述。
  • 解决在不依赖预定义信号模型的前提下,检测稀有或意外事件(如标准模型之外的新物理)的挑战。
  • 评估无监督、弱监督及自监督异常检测方法在复杂、高维HEP数据中的性能与局限性。
  • 探索在实时触发、探测器监控以及高能物理数据分析中新兴的量子机器学习应用。
  • 识别在验证异常检测算法方面存在的开放挑战,特别是新物理搜索中缺乏严格、客观的性能度量标准。

提出的方法

  • 根据监督程度对异常检测方法进行分类:弱监督、自监督及无监督学习范式。
  • 回顾密度估计与异常值检测作为识别高能物理数据中分布外事件的核心方法。
  • 提出将替代假设参数化,作为在模型无关框架中建模未知新物理的一种方式。
  • 讨论使用轻量化模型实现实时异常检测,适用于高亮度对撞机实验中的在线触发。
  • 探讨利用异常检测进行探测器监控的应用,以识别硬件故障或数据质量问题,而无需标注异常。
  • 探索高能物理中的量子机器学习(QML),重点关注其在建模对撞数据中量子关联方面的潜在优势,尽管当前硬件仍有限制。

实验结果

研究问题

  • RQ1机器学习如何在不假设特定信号模型的前提下,实现高能物理中模型无关的新物理搜索?
  • RQ2无监督与弱监督异常检测方法在检测高能对撞数据中稀有或意外事件方面的性能与局限性是什么?
  • RQ3异常检测如何有效应用于实时触发系统,以在无先验信号特征知识的情况下筛选事件?
  • RQ4异常检测在自动化数据质量与探测器监控中可发挥何种作用,以减少人工验证工作量?
  • RQ5量子机器学习在分析对撞事件中存在量子关联的数据方面,相较于经典模型可能具有哪些优势?

主要发现

  • 模型无关的异常检测可同时搜索多种新物理情景,而不会偏向任何特定信号模型。
  • 无监督与自监督方法在检测高维对撞机数据中的异常方面已显示出潜力,尤其是在结合密度估计或基于重建的方法时。
  • 异常检测现已在高能物理实验中实际应用,用于数据质量监控,显著减少了人工验证工作量。
  • 实时异常检测系统正在为高亮度LHC数据采集开发,以应对极高的事件率。
  • 量子机器学习在真实HEP数据上仍基本未经测试,但理论研究表明其在建模对撞事件中出现的量子关联方面具有潜在优势。
  • 一个主要的开放挑战是缺乏严格、客观的度量标准来验证新物理搜索中的异常检测算法,因为模拟基准上的表现并不能保证真实世界中的有效性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。