Skip to main content
QUICK REVIEW

[논문 리뷰] Generative Machine Learning for Detector Response Modeling with a Conditional Normalizing Flow

Allison Xu, S. Han|arXiv (Cornell University)|2023. 03. 17.
Particle physics theoretical and experimental studies인용 수 10
한 줄 요약

이 논문은 Higgs to diphoton 이벤트에 대한 검출기 반응을 시뮬레이션하기 위해 조건부 정규화 흐름(CNF) 모델을 개발하고, 상관관계와 비대칭 효과를 포착하여 비용이 큰 몬테카를로 시뮬레이션을 대체한다.

ABSTRACT

In this paper, we explore the potential of generative machine learning models as an alternative to the computationally expensive Monte Carlo (MC) simulations commonly used by the Large Hadron Collider (LHC) experiments. Our objective is to develop a generative model capable of efficiently simulating detector responses for specific particle observables, focusing on the correlations between detector responses of different particles in the same event and accommodating asymmetric detector responses. We present a conditional normalizing flow model (CNF) based on a chain of Masked Autoregressive Flows, which effectively incorporates conditional variables and models high-dimensional density distributions. We assess the performance of the \cnf model using a simulated sample of Higgs boson decaying to diphoton events at the LHC. We create reconstruction-level observables using a smearing technique. We show that conditional normalizing flows can accurately model complex detector responses and their correlation. This method can potentially reduce the computational burden associated with generating large numbers of simulated events while ensuring that the generated events meet the requirements for data analyses.

연구 동기 및 목표

  • 특정 관측값에 대해 비용이 높은 MC 검출기 시뮬레이션을 생성적 접근 방식으로 대체하는 것을 동기화하는 것이 목표이다.
  • 이벤트 변수 및 입자 운동학에 조건화된 검출기 반응을 학습한다.
  • 같은 이벤트 내 여러 입자의 검출기 반응 간 상관관계를 모델링한다.
  • 단순한 블러링 기법을 넘어 비대칭적인 검출기 반응 분포를 다룬다.
  • Higgs to diphoton 분석에의 적용 가능성을 시연하고, 잠재적으로 다른 검출기 및 관측값으로 확장할 수 있다.

제안 방법

  • 순열을 포함한 Masked Autoregressive Flows(MAF)의 체인으로 구성된 조건부 정규화 흐름을 사용한다.
  • CNF를 pileup과 실제 입자 운동학에 조건화하여 고차원 검출기 반응 분포를 모델링한다.
  • 두 광자의 E_T, η, φ에 대한 여섯 개 detector-response 변수(ΔX)를 6D 타깃으로, 6D 기본 밀도로 모델링한다.
  • 출력을 [-1,1]로 스케일링하고 tanh 바이젝션을 적용하여 결과를 범위 내에 유지한다.
  • 500 에폭으로 Adam을 사용하여 학습하고 거듭제곱 감소형 학습률로 감소시키며 여섯 개 detector 변수에 대한 평균 Wasserstein Distance를 모니터링한다.
  • 데이터를 학습/검증/테스트에 대해 80/10/10으로 분할하고 평균 WD가 최소인 모델을 최적 모델로 선택한다.
Figure 1 : The mean Wasserstein Distance (orange) and the minimum Wasserstein distance (blue) as a function of the training epochs for the baseline scenario. These quantities were evaluated on the validation sample.
Figure 1 : The mean Wasserstein Distance (orange) and the minimum Wasserstein distance (blue) as a function of the training epochs for the baseline scenario. These quantities were evaluated on the validation sample.

실험 결과

연구 질문

  • RQ1CNF가 이벤트 변수에 조건화된 두 광자의 검출기 반응의 전체 결합 분포를 학습할 수 있는가?
  • RQ2CNF가 광자 검출기 반응 간의 상관관계를 재현하고 비대칭적인 검출기 효과를 다룰 수 있는가?
  • RQ3CNF가 목표로 하는 검출 해상도와 diphoton 질량 및 diphoton 시스템 p_T 분포를 얼마나 잘 근사하는가?
  • RQ4복잡한 의존성 시나리오에서 기존의 스미어링 방법과 비교한 성능 영향은 어떠한가?

주요 결과

  • 기본 시나리오는 목표와 CNF가 학습한 검출기 해상도 간의 좋은 일치를 보여주며 (<5% 차이).
  • CNF가 검출기 수준에서 광자 운동학 변수(E_T, η, φ)의 분포를 좋은 일치로 재현한다.
  • 상관 시나리오에서 ρ = 0.5 및 ρ = 1.0에 대해 두 광자 간의 상관을 CNF가 정확히 포착한다.
  • 비대칭 검출기 반응 시나리오에서 CNF가 검출기 반응 분포의 비대칭 꼬리 부분을 재현한다.
  • 통계적 정밀도 내에서 CNF와 일치하는 diphoton 불변 질량 및 diphoton 시스템 p_T 분포이다.
Figure 2 : Target and generated photon resolutions $\sigma$ for photon kinematic variables $E_{\text{T}}$ , $\eta$ , and $\phi$ . The resolutions are shown as functions of the true values of photon $E_{\text{T}}$ and $\eta$ , and the event pile-up $\mu$ . The blue (orange) entries represent the targ
Figure 2 : Target and generated photon resolutions $\sigma$ for photon kinematic variables $E_{\text{T}}$ , $\eta$ , and $\phi$ . The resolutions are shown as functions of the true values of photon $E_{\text{T}}$ and $\eta$ , and the event pile-up $\mu$ . The blue (orange) entries represent the targ

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.