Skip to main content
QUICK REVIEW

[논문 리뷰] Reweighting simulated events using machine-learning techniques in the CMS experiment

Hayrapetyan, Aram, A. Tumasyan|arXiv (Cornell University)|2024. 01. 01.
Particle physics theoretical and experimental studies인용 수 2
한 줄 요약

이 논문은 CMS 실험에서 기계학습 기반 재가중 기법을 제안하며, 비용이 많이 드는 검출기 시뮬레이션을 다시 실행하지 않고도 시뮬레이션된 입자 충돌 사건을 다양한 물리 모델이나 고차수 계산으로 효율적으로 재교정할 수 있도록 한다. 생성기 수준의 운동량 변수로부터 이벤트 가중치를 학습하는 깊이 신경망을 훈련시킴으로써, 하나의 고통계 시뮬레이션 샘플을 유지하면서도 CPU 및 스토리지 비용을 절감하고, LHC에서의 톰 쿼크 쌍 생성에 대한 정밀한 불확도 추정을 가능하게 한다.

ABSTRACT

Data analyses in particle physics rely on an accurate simulation of particle collisions and a detailed simulation of detector effects to extract physics knowledge from the recorded data. Event generators together with a GEANT-based simulation of the detectors are used to produce large samples of simulated events for analysis by the LHC experiments. These simulations come at a high computational cost, where the detector simulation and reconstruction algorithms have the largest CPU demands. This article describes how machine-learning (ML) techniques are used to reweight simulated samples obtained with a given set of model parameters to samples with different parameters or samples obtained from entirely different models. The ML reweighting method avoids the need for simulating the detector response multiple times by incorporating the relevant information in a single sample through event weights. Results are presented for reweighting to model variations and higher-order calculations in simulated top quark pair production at the LHC. This ML-based reweighting is an important element of the future computing model of the CMS experiment and will facilitate precision measurements at the High-Luminosity LHC.

연구 동기 및 목표

  • LHC 데이터 분석에서 시스템적 불확도 평가를 위한 다수의 시뮬레이션 이벤트 샘플을 생산하는 데 드는 계산 비용을 줄이기 위해.
  • 향후 고광도 LHC에서 예상되는 증가하는 CPU 및 스토리지 수요를 해결하기 위해, 연간 최대 1600억 개의 이벤트가 필요할 수 있는 시뮬레이션 환경을 고려하여.
  • 작은 제한된 샘플 대신 고통계의 노멀 샘플을 활용함으로써 시스템적 불확도 평가의 통계적 정밀도를 향상시키기 위해.
  • 기계학습을 활용해 다양한 물리적 매개변수와 이론 모델에 걸쳐 연속적이고 고차원적인 이벤트 재가중을 가능하게 하여, 시뮬레이션된 이벤트를 지속적으로 재교정하기 위해.

제안 방법

  • 노멀 시뮬레이션과 다양한 매개변수 또는 고차수 계산을 가진 타겟 시뮬레이션 간의 가능도 비율을 학습하는 깊이 신경망(DCTR)을 훈련한다.
  • 검출기 시뮬레이션을 훈련 중에 수행할 필요 없이, 이벤트 샘플의 생성기 수준 운동량 변수에서 모델을 훈련시킨다.
  • 네트워크 출력에서 유도된 이벤트 가중치를 사용하여 노멀 샘플을 재가중하여 타겟 분포와 일치시킨다.
  • 이 방법은 파arton 스프레드 레이저를 변화시키는 등의 이산적 재가중과, b-쿼크 분해형태 조정 매개변수를 조절하는 등의 연속적 재가중을 모두 지원한다.
  • 검출기 재시뮬레이션 없이도 NLO에서 NNLO QCD 계산으로의 재가중이 가능하다.
  • 훈련된 모델은 효율적으로 저장되며, 분석 워크플로우의 어느 단계에서든 원활하게 통합될 수 있다.

실험 결과

연구 질문

  • RQ1기계학습 기반 재가중 기법이 LHC 실험에서 다수의 비용이 많이 드는 검출기 시뮬레이션을 줄이는 데 기여할 수 있는가?
  • RQ2기계학습 기반 재가중 기법이 고차수 계산이나 모델 변화로부터 유도된 시스템적 불확도를 얼마나 정확하게 재현할 수 있는가?
  • RQ3하나의 고통계 노멀 샘플을 사용한 재가중이, 더 작은 전용 샘플을 사용하는 전통적 방법보다 성능이 뛰어나게 될 수 있는가?
  • RQ4히스토그램 기반 방법과 비교했을 때, 기계학습 기반 재가중 기법이 이벤트 운동량의 상관관계와 고차원적 구조를 얼마나 잘 유지할 수 있는가?
  • RQ5이 방법은 톰 쿼크 쌍 생성에서 연속적인 매개변수 변화와 고차수 QCD 계산으로 일반화될 수 있는가?

주요 결과

  • 기계학습 기반 재가중 기법은 모델 변화나 고차수 계산으로부터 유도된 시스템적 불확도를 매우 정밀하게 재현하여, 다수의 검출기 시뮬레이션을 다시 실행할 필요를 줄였다.
  • 톰 쿼크 쌍 생성에 대해 NLO에서 NNLO로의 재가중이 최소한의 정확도 손실로 이루어져 정밀한 단면적 측정이 가능했다.
  • 다른 매개변수 조합에 대해 검출기 재시뮬레이션과 재구성 과정을 반복하지 않음으로써 계산 비용이 크게 감소했다.
  • 작은 변형 전용 샘플 대비 고통계의 노멀 샘플을 사용함으로써 불확도 평가의 통계적 정밀도가 크게 향상되었다.
  • 완전한 이벤트 샘플 대비 훈련된 기계학습 모델은 저장 공간을 거의 차지하지 않아 데이터 관리가 용이했다.
  • 이 방법은 분석 워크플로우에 원활하게 통합 가능했으며, 연속적인 매개변수 의존성도 지원하여 시뮬레이션 변형 간의 보간이 가능했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.