Skip to main content
QUICK REVIEW

[论文解读] Lorentz Group Equivariant Neural Network for Particle Physics

Alexander Bogatskiy, Brandon Anderson|arXiv (Cornell University)|Jun 8, 2020
Computational Physics and Python Applications参考文献 46被引用 68
一句话总结

一个使用有限维洛伦兹表示和Clebsch-Gordan分解构建的洛伦兹群等变神经网络(LGN),应用于喷气成分的能量-动量以进行顶夸克标记。该方法产生紧凑、可解释的模型,在公开数据集上具有竞争性能。

ABSTRACT

We present a neural network architecture that is fully equivariant with respect to transformations under the Lorentz group, a fundamental symmetry of space and time in physics. The architecture is based on the theory of the finite-dimensional representations of the Lorentz group and the equivariant nonlinearity involves the tensor product. For classification tasks in particle physics, we demonstrate that such an equivariant architecture leads to drastically simpler models that have relatively few learnable parameters and are much more physically interpretable than leading approaches that use CNNs and point cloud approaches. The competitive performance of the network is demonstrated on a public classification dataset [27] for tagging top quark decays given energy-momenta of jet constituents produced in proton-proton collisions.

研究动机与目标

  • 将基本的洛伦兹对称性引入神经网络以用于高能物理数据的动机。
  • 开发一个对洛伦兹变换完全等变的架构,使用有限维表示。
  • 与CNN和点云方法相比,展示参数效率和可解释性。
  • 将模型应用于公开的喷气能量-动量分类数据集,以标记顶夸克衰变。

提出的方法

  • 使用洛伦兹群的有限维表示以确保模型的等变性。
  • 利用张量积和Clebsch-Gordan分解来构建洛伦兹等变非线性。
  • 通过同类分量(Clebsch-Gordan)块及每块矩阵对等变线性映射进行参数化。
  • 训练一个架构,使激活位于洛伦兹表示中,且不变量驱动最终输出。
  • 在一个应用于SL(2,C)和SO+(1,3)表示的等变通用近似框架中,将该方法落地。

实验结果

研究问题

  • RQ1一个洛伦兹群等变网络是否能仅使用洛伦兹不变输入和等变处理就达到有竞争力的顶夸克标记性能?
  • RQ2相较于非等变基线,强制洛伦兹等变性对模型大小、可解释性和学习效率有何影响?
  • RQ3在学习来自喷气能量-动量数据的洛伦兹不变和等变量时,利用Clebsch-Gordan分解的实际收益是什么?

主要发现

  • LGN 架构在构建时就对洛伦兹群完全等变。
  • 张量积和 Clebsch-Gordan 分解提供了洛伦兹等变学习的非线性和线性构建块。
  • 基于表示的设计产生的模型具有相对较少的可学习参数且比CNN或点云方法具有更强的物理可解释性。
  • 该方法在公开的 KasPleThRu19 数据集上用于使用喷气成分能量-动量的顶夸克标记,显示出竞争性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。