Skip to main content
QUICK REVIEW

[論文レビュー] Playing Tag with ANN: Boosted Top Identification with Pattern Recognition

Leandro G. Almeida, Mihailo Backović|arXiv (Cornell University)|Jan 23, 2015
Particle physics theoretical and experimental studies参考文献 38被引用数 20
ひとこと要約

本論文では、人工ニューラルネットワーク(ANN)を用いた新しいトップタギングアルゴリズムを提案する。この手法は、ハドロン化カルォリメータのエネルギー堆積をデジタル画像として扱い、パターン認識を可能にする。ANNは、pT = 1100–1200 GeVのジェットに対して60%のトップタグ効率を達成し、誤タグ率はたった4%にとどまり、複雑なエネルギー堆積パターンのエンドツーエンド学習により、従来のジェットサブストラクチャ手法を上回る性能を発揮する。

ABSTRACT

Many searches for physics beyond the Standard Model at the Large Hadron Collider (LHC) rely on top tagging algorithms, which discriminate between boosted hadronic top quarks and the much more common jets initiated by light quarks and gluons. We note that the hadronic calorimeter (HCAL) effectively takes a "digital image" of each jet, with pixel intensities given by energy deposits in individual HCAL cells. Viewed in this way, top tagging becomes a canonical pattern recognition problem. With this motivation, we present a novel top tagging algorithm based on an Artificial Neural Network (ANN), one of the most popular approaches to pattern recognition. The ANN is trained on a large sample of boosted tops and light quark/gluon jets, and is then applied to independent test samples. The ANN tagger demonstrated excellent performance in a Monte Carlo study: for example, for jets with p_T in the 1100-1200 GeV range, 60% top-tag efficiency can be achieved with a 4% mis-tag rate. We discuss the physical features of the jets identified by the ANN tagger as the most important for classification, as well as correlations between the ANN tagger and some of the familiar top-tagging observables and algorithms.

研究の動機と目的

  • ハドロン化カルォリメータデータのパターン認識を活用して、LHCにおけるブーストドトップクォークの識別を改善すること。
  • 非常に凝縮したトップクォーク崩壊とQCDジェットを区別する際、古典的ジェットサブストラクチャ手法の限界を克服すること。
  • 生のカルォリメータエネルギー堆積を直接トップタギング意思決定にマッピングするエンドツーエンド学習アプローチを構築すること。
  • TOM、N-サブジェット性、ATLASタガーモデルなどの既存のトップタギングアルゴリズムと比較して、ANNタガーモデルの性能をベンチマークすること。
  • 分類に最も寄与する物理的特徴を分析し、従来の観測量との相関関係を理解すること。

提案手法

  • 各ジェットのセルごとのハドロン化カルォリメータ(HCAL)エネルギー堆積を、2次元デジタル画像としてのピクセル強度として扱う。
  • 大規模なモンテカルロサンプルを用いて、ブーストドトップクォークとライトクォーク/グルーオンジェットの両方のデータを、画像に似たHCALデータを入力として、人工ニューラルネットワーク(ANN)を学習させる。
  • 手動で設計されたジェットサブストラクチャ観測量を必要とせず、生のエネルギー堆積から階層的な特徴を学習する。
  • 独立したテストサンプルを用いて性能を評価し、トップタグ効率と誤タグ率の観点から性能を測定する。
  • TOM(テンプレートオーバーラップ法)、N-サブジェット性、ATLASトップタガーモデルなどの標準的なトップタギング手法と性能を比較する。
  • 特徴の重要度を分析し、分類意思決定に最も影響を与えるカルォリメータセルのパターンを同定する。

実験結果

リサーチクエスチョン

  • RQ1生のカルォリメータエネルギー堆積を学習対象としたディープラーニングモデルは、従来のジェットサブストラクチャ観測量を上回り、ブーストドトップクォークを識別できるか?
  • RQ2ジェットエネルギー堆積パターン内での、ANNがトップクォークとQCDジェットを区別するために最も重要な物理的特徴は何か?
  • RQ3TOM、N-サブジェット性、ATLASタガーモデルなどの既存のトップタギングアルゴリズムと比較して、ANNタガーモデルの性能はどの程度か?
  • RQ4ANNタガーモデルの予測は、従来のトップタギング観測量とどの程度相関しているか?
  • RQ5画像に似たカルォリメータデータからのエンドツーエンド学習は、高エネルギー物理学におけるより強固で効率的なトップタギングを実現できるか?

主な発見

  • pTが1100–1200 GeVのジェットに対して、ANNタガーモデルは60%のトップタグ効率を達成し、誤タグ率は4%にとどまり、優れた性能を示した。
  • ANNは、QCD放射線が存在する中でも、ハドロン的に崩壊するトップクォークの特徴的な三本のブランチ構造を持つエネルギー堆積パターンを学習して識別した。
  • 誤タグ率を固定した場合、N-サブジェット性やATLASタガーモデルといった従来手法よりも、信号効率の面で優れた性能を示した。
  • 分類に最も重要な特徴は、三体崩壊に一致する局所的エネルギー堆積であり、特にトップクォークの三つの崩壊生成物に対応する領域に顕著に現れた。
  • ANNの予測はN-サブジェット性比τ3/τ2と強く相関しており、三叉のジェット構造に感受していることが裏付けられた。
  • 本手法は検出器レベルの影響に対しても頑健であり、ジェットサブストラクチャにおけるパターン認識の汎用的フレームワークを提供した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。