Skip to main content
QUICK REVIEW

[論文レビュー] Lorentz Group Equivariant Neural Network for Particle Physics

Alexander Bogatskiy, Brandon Anderson|arXiv (Cornell University)|Jun 8, 2020
Computational Physics and Python Applications参考文献 46被引用数 68
ひとこと要約

Lorentz group equivariant neural network (LGN) は、有限次元の Lorentz 表現と Clebsch-Gordan 分解を用いて構築され、トップクォークの分類のためのジェット構成要素のエネルギー-運動量に適用されます。このアプローチは、公開データセットで競争力のある性能を持つ、コンパクトで解釈可能なモデルを生み出します。

ABSTRACT

We present a neural network architecture that is fully equivariant with respect to transformations under the Lorentz group, a fundamental symmetry of space and time in physics. The architecture is based on the theory of the finite-dimensional representations of the Lorentz group and the equivariant nonlinearity involves the tensor product. For classification tasks in particle physics, we demonstrate that such an equivariant architecture leads to drastically simpler models that have relatively few learnable parameters and are much more physically interpretable than leading approaches that use CNNs and point cloud approaches. The competitive performance of the network is demonstrated on a public classification dataset [27] for tagging top quark decays given energy-momenta of jet constituents produced in proton-proton collisions.

研究の動機と目的

  • 高エネルギー物理データに対して、神経ネットワークに基本的な Lorentz 対称性を組み込む動機づけ。
  • 有限次元表現を用いて Lorentz 変換の下で完全に等方なアーキテクチャを開発する。
  • CNN や点群法と比較してパラメータ効率と解釈性を示す。
  • 公開ジェットエネルギー-運動量分類データセットにモデルを適用して、トップクォーク崩壊をタグ付けする。

提案手法

  • モデルの等変性を保証するために Lorentz 群の有限次元表現を用いる。
  • テンソル積と Clebsch-Gordan 分解を用いて Lorentz 等変非線形性を構築する。
  • 等変線形写像を等同成分(Clebsch-Gordan)ブロックと各ブロック行列でパラメータ化する。
  • アクティベーションが Lorentz 表現に存在し、不変量が最終出力を駆動するアーキテクチャを訓練する。
  • SL(2,C) および SO+(1,3) 表現に適用可能な等変普遍近似フレームワークに基づいてアプローチを地盤づけする。

実験結果

リサーチクエスチョン

  • RQ1Lorentz 群等変ネットワークが Lorentz 不変入力と等変処理だけを用いて、トップクォーク分類の性能で競争力を持てるか。
  • RQ2等変性を課すことは、モデルサイズ、解釈性、学習効率を非等変ベースラインと比べてどう影響するか。
  • RQ3ジェットエネルギー-運動量データから Lorentz 不変量および等変量を学習するための Clebsch-Gordan 分解の実用的な利点は何か。

主な発見

  • LGN アーキテクチャは構築上、Lorentz 群の下で完全に等変である。
  • テンソル積と Clebsch-Gordan 分解は、Lorentz 等変学習の非線形および線形の構築要素を提供する。
  • 表現ベースの設計は、CNN や点群アプローチと比較して、比較的少ない学習可能パラメータと物理的解釈性の向上をもたらす。
  • この手法は、ジェット成分のエネルギー-運動量を用いたトップクォーク分類の公開データ KasPleThRu19_dataset でデモンストレーションされ、競争力のある性能を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。