Skip to main content
QUICK REVIEW

[論文レビュー] Reweighting simulated events using machine-learning techniques in the CMS experiment

Hayrapetyan, Aram, A. Tumasyan|arXiv (Cornell University)|Jan 1, 2024
Particle physics theoretical and experimental studies被引用数 2
ひとこと要約

本論文では、CMS実験における機械学習ベースの再重み付け手法を提示しており、高価な検出器シミュレーションを再実行することなく、異なる物理学モデルや高次の計算に効率的に再キャリブレーション可能なシミュレートされた粒子衝突イベントの再調整を可能にする。生成器レベルの運動量から得られるイベント重みを学習するための深層ニューラルネットワークを訓練することで、1つの高統計的サンプルを維持しつつ、CPUおよびストレージコストを削減し、LHCにおけるトップクォーク対生成の不確実性推定を高精度で行える。

ABSTRACT

Data analyses in particle physics rely on an accurate simulation of particle collisions and a detailed simulation of detector effects to extract physics knowledge from the recorded data. Event generators together with a GEANT-based simulation of the detectors are used to produce large samples of simulated events for analysis by the LHC experiments. These simulations come at a high computational cost, where the detector simulation and reconstruction algorithms have the largest CPU demands. This article describes how machine-learning (ML) techniques are used to reweight simulated samples obtained with a given set of model parameters to samples with different parameters or samples obtained from entirely different models. The ML reweighting method avoids the need for simulating the detector response multiple times by incorporating the relevant information in a single sample through event weights. Results are presented for reweighting to model variations and higher-order calculations in simulated top quark pair production at the LHC. This ML-based reweighting is an important element of the future computing model of the CMS experiment and will facilitate precision measurements at the High-Luminosity LHC.

研究の動機と目的

  • LHCデータ解析におけるシステムティック不確実性推定のための複数のシミュレート済みイベントサンプルを生成するための計算コストを低減すること。
  • High-Luminosity LHCにおいて予想される増大するCPUおよびストレージ要件に対応すること。ここでは、1年あたり最大1600億イベントのシミュレーションが必要となる可能性がある。
  • より高い統計的精度でシステムティック不確実性評価を実現するため、小規模で限られたサンプルではなく、高統計的ノーマルサンプルを活用すること。
  • 機械学習を用いて、物理的パラメータや理論的モデルの変化に応じた、連続的かつ高次元のシミュレート済みイベントの再重み付けを可能にすること。

提案手法

  • ノーマルシミュレーションと異なるパラメータまたは高次の計算を持つターゲットシミュレーション間の尤度比を学習するため、深層ニューラルネットワーク(DCTR)を訓練する。
  • 訓練段階では、検出器シミュレーションを経由しない生成器レベルの運動量変数からなるイベントサンプルを用いる。
  • ネットワークの出力から得られるイベント重みを用いて、ノーマルサンプルをターゲット分布に再重み付けする。
  • 離散的再重み付け(例:部分子シャワーラジエーションの変更)と連続的再重み付け(例:bクォークフラグメンテーションパラメータのチューニング)の両方をサポートする。
  • 検出器の再シミュレーションを伴わずに、次-leading order(NLO)から次々--leading order(NNLO)のQCD計算への再重み付けを可能にする。
  • 訓練済みモデルは効率的に保存可能であり、解析ワークフローの任意の段階でシームレスに統合可能である。

実験結果

リサーチクエスチョン

  • RQ1機械学習による再重み付けは、LHC実験における複数回の高価な検出器シミュレーションの必要性を低減できるか?
  • RQ2MLベースの再重み付けは、高次の計算やモデル変更からのシステムティック不確実性をどれほど高精度に再現できるか?
  • RQ31つの高統計的ノーマルサンプルによる再重み付けは、従来の小規模で専用のサンプルを用いた手法を上回る性能を発揮できるか?
  • RQ4ヒストグラムベースの手法と比較して、ML再重み付けはイベント運動量の相関構造や高次元構造をどの程度正確に保持できるか?
  • RQ5本手法は、トップクォーク対生成における連続的パラメータ変化および高次のQCD計算へ一般化可能か?

主な発見

  • ML再重み付け手法は、モデル変更や高次の計算からのシステムティック不確実性を高い忠実度で再現でき、複数回の検出器シミュレーションの必要性を大幅に削減した。
  • トップクォーク対生成におけるNLOからNNLOへの再重み付けが、最小限の精度損失で実現され、正確な断面積測定が可能になった。
  • 代替パラメータセットのための繰り返しの検出器シミュレーションと再構築を回避することで、計算コストが著しく削減された。
  • ノーマルサンプルを高統計的ものにすることで、システムティック不確実性推定の統計的精度が顕著に向上した。
  • 訓練済みMLモデルは、完全なイベントサンプルと比較して極めて小さなストレージ容量に収まり、データ管理を容易にした。
  • 本手法は解析ワークフローにシームレスに統合可能であり、連続的パラメータ依存性をサポートしており、シミュレーション変更の間隔を補間可能にした。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。