Skip to main content
QUICK REVIEW

[論文レビュー] Using Machine Learning to disentangle LHC signatures of Dark Matter candidates

Charanjit K. Khosa, Verónica Sanz|arXiv (Cornell University)|Oct 14, 2019
Particle physics theoretical and experimental studies参考文献 44被引用数 18
ひとこと要約

この論文は、モノジェットおよびジジェットイベントに伴う横断的運動量(MET)を伴う、ダークマター(DM)候補の衝突機器シグナルを分離するための機械学習フレームワークを提案する。具体的には、SUSYのWIMP、軸子様粒子(ALP)、および重いメディエーターを持つ軽いDMを対象としている。従来の運動量特徴量と2次元画像表現のイベント分布を比較し、2次元画像に畳み込みニューラルネットワーク(CNN)を適用することで、特に組み合わせ的複雑性の高い最終状態において、従来手法をはるかに上回る識別性能を示した。

ABSTRACT

We study the prospects of characterising Dark Matter at colliders using Machine Learning (ML) techniques. We focus on the monojet and missing transverse energy (MET) channel and propose a set of benchmark models for the study: a typical WIMP Dark Matter candidate in the form of a SUSY neutralino, a pseudo-Goldstone impostor in the shape of an Axion-Like Particle, and a light Dark Matter impostor whose interactions are mediated by a heavy particle. All these benchmarks are tensioned against each other, and against the main SM background ($Z$+jets). Our analysis uses both the leading-order kinematic features as well as the information of an additional hard jet. We explore different representations of the data, from a simple event data sample with values of kinematic variables fed into a Logistic Regression algorithm or a Fully Connected Neural Network, to a transformation of the data into images related to probability distributions, fed to Deep and Convolutional Neural Networks. We also study the robustness of our method against including detector effects, dropping kinematic variables, or changing the number of events per image. In the case of signals with more combinatorial possibilities (events with more than one hard jet), the most crucial data features are selected by performing a Principal Component Analysis. We compare the performance of all these methods, and find that using the 2D images of the combined information of multiple events significantly improves the discrimination performance.

研究の動機と目的

  • モノジェットおよびジジェット探索における複数のダークマター候補と模倣者を区別する課題に対処し、従来手法が直面するデゲネラシーを解消すること。
  • 生産断面積に依存しない、微分運動量特徴量に基づくDMシグナルの特徴付けに機械学習手法の有効性を評価すること。
  • ロジスティック回帰、全結合ネットワーク、および深層CNNといったさまざまなMLモデルの性能を、生の運動量変数と2次元ヒストグラムの2種類のデータ表現に対して比較すること。
  • 現実的なシミュレーション条件下での検出器効果、欠落運動量変数、および信号対背景比の変動に対するロバストネスを評価すること。
  • 複数イベントの運動量情報の画像表現が、単一イベント特徴量を上回る識別能力を向上させるかどうかを検証すること。

提案手法

  • ベンチマークモデルには、100 GeVのSUSY中性子(WIMP)、300 GeVのALP、スピン1のメディエーターを持つ簡略化モデルを含み、すべてが標準模型(SM)Z+ジェット背景と比較される。
  • 運動量特徴量には、ジェットの横断的運動量、準縁度、角度的分離、およびMETが含まれ、ジジェットイベントでは追加でハードジェット情報が使用される。
  • データは3つの形で表現される:(1) ロジスティック回帰および全結合ニューラルネットワークに供給される生の運動量変数;(2) 深層ニューラルネットワーク(DNN)の入力として使用される運動量分布の2次元ヒストグラム;(3) 2次元ヒストグラムを畳み込みニューラルネットワーク(CNN)に供給する処理。
  • 組み合わせ的複雑性の高いジジェットイベントにおける次元削減と主要特徴の同定のため、主成分分析(PCA)が適用される。
  • ローレル(LO)の部分素粒子レベルとNLOの検出器レベルの両方でシミュレーションが実施され、現実的な検出器効果を含むことでロバストネスをテストする。
  • AUC(受信者操作特性曲線下の面積)を用いて性能を評価し、信号タイプ、データ表現、信号対背景比の違いによる比較が行われる。

実験結果

リサーチクエスチョン

  • RQ1モノジェットおよびジジェットイベントにおいて、最終状態のシグナルが類似している場合に、機械学習手法がWIMP、ALP、および軽いDMといった異なるダークマター候補を効果的に分離できるか。
  • RQ2運動量データの表現方法(生変数、2次元ヒストグラム、画像様分布)が、ML分類器の識別力にどのように影響するか。
  • RQ3複数イベントの運動量分布の2次元画像表現に訓練されたCNNが、生運動量特徴量に適用された従来のMLモデルをどの程度上回るか。
  • RQ4現実的な検出器効果、欠落運動量変数、および低信号対背景比に対するこれらのML手法のロバストネスはどの程度か。
  • RQ5異なる運動量変数の相対的な重要度は何か。また、PCAは最も情報を含む特徴を特定するのに役立つか。

主な発見

  • 特にCNNに供給される、結合運動量情報の2次元画像表現の使用は、生運動量変数に基づく従来手法をはるかに上回る信号識別性能を顕著に向上させる。
  • モノジェットチャンネルでは、2次元ヒストグラムをDNNに供給した最良のモデルが、EFTベンチマークでAUC 0.72、SUSY2でAUC 0.70を達成し、強力な識別能力を示した。
  • ジジェットチャンネルでは、2次元ヒストグラムにCNNを適用したモデルが、SUSY WIMPとALP、およびEFTモデルを区別する性能が優れており、特にDM質量が高い場合に顕著であった。
  • ALPシグナルはSM背景と類似していたため、最も識別が難しく、検出器レベルでAUC ≈ 0.57にとどまり、SM過程との類似性を示した。
  • 信号対背景比が低い(NSig ≪ NBG)場合、性能が低下する傾向にあり、これは本手法が発見的用途にはあまり適さず、発見後の特徴付けに有用であることを示唆している。
  • PCA分析により、MET、ジェット角度、および横断的運動量の組み合わせが最も情報量が多く、バックグラウンドおよび信号分布の大部分の分散をPC-1およびPC-2が捉えていることが判明した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。