Skip to main content
QUICK REVIEW

[论文解读] Convolutional L2LFlows: Generating Accurate Showers in Highly Granular Calorimeters Using Convolutional Normalizing Flows

Thorsten Buss, Frank Gaede|arXiv (Cornell University)|Jan 1, 2024
Soil Moisture and Remote Sensing被引用 4
一句话总结

该论文提出了一种名为Convolutional L2LFlows的归一化流模型,该模型采用卷积层、U-Net跳跃连接和耦合流,用于在高度颗粒化的电磁量能器中生成高保真度的粒子簇射。该模型在30×30×30体素的ILD和CaloChallenge Dataset 3数据集上实现了最先进的保真度,其在GPU上的生成速度比Geant4快331倍,且性能与BIB-AE等先前模型相当或更优。

ABSTRACT

In the quest to build generative surrogate models as computationally efficient alternatives to rule-based simulations, the quality of the generated samples remains a crucial frontier. So far, normalizing flows have been among the models with the best fidelity. However, as the latent space in such models is required to have the same dimensionality as the data space, scaling up normalizing flows to high dimensional datasets is not straightforward. The prior L2LFlows approach successfully used a series of separate normalizing flows and sequence of conditioning steps to circumvent this problem. In this work, we extend L2LFlows to simulate showers with a 9-times larger profile in the lateral direction. To achieve this, we introduce convolutional layers and U-Net-type connections, move from masked autoregressive flows to coupling layers, and demonstrate the successful modelling of showers in the ILD Electromagnetic Calorimeter as well as Dataset 3 from the public CaloChallenge dataset.

研究动机与目标

  • 解决归一化流在高维粒子簇射模拟中面临的可扩展性和保真度限制。
  • 将L2LFlows框架扩展至处理比以往工作大9倍的横向分布(30×30×30个体素)。
  • 通过使用卷积层和U-Net风格跳跃连接,提升流的效率和信息流动。
  • 用耦合流替代掩码自回归流,以实现更快的训练和推理速度。
  • 在真实世界数据集(ILD GettingHigh和CaloChallenge Dataset 3)上展示最先进的性能。

提出的方法

  • 用耦合层替代掩码自回归流,以支持快速、可并行化的前向和反向传播。
  • 引入2D卷积层,以利用量能器层中的横向平移对称性。
  • 引入U-Net风格跳跃连接,以增强跨尺度的特征学习并改善训练收敛性。
  • 在层间使用因果条件控制,以保持自回归结构的同时实现高效计算。
  • 在流生成后应用后处理,以校正能量沉积和簇射分布中的残余偏差。
  • 使用具有可计算雅可比行列式的最大似然估计方法进行端到端训练。

实验结果

研究问题

  • RQ1卷积层和U-Net跳跃连接是否能提升归一化流在高维簇射数据上的可扩展性和保真度?
  • RQ2用耦合流替代掩码自回归流是否能在不损失样本质量的前提下实现更快的推理速度?
  • RQ3该模型在ILD和CaloChallenge Dataset 3等复杂真实数据集上的泛化能力如何?
  • RQ4与现有代理模型相比,该模型是否能在保持高保真度的同时实现计算效率的显著提升?
  • RQ5架构创新对Wasserstein距离和基于分类器的评估指标有何影响?

主要发现

  • 在GettingHigh数据集上,该模型在所有可观测量上的Wasserstein距离均显著低于BIB-AE,能量沉积和分布可观测量的中位距离低于10−3。
  • 在CaloChallenge Dataset 3上,该模型将Wasserstein距离降低了最多达2.5倍,表明在更复杂、高能数据集上具有更优的保真度。
  • 在GPU上推理速度相比Geant4提升了1,260倍(批量大小为1,000),每簇射的推理时间降至仅3.24毫秒。
  • 在GPU上,该模型对100个批量的30×30×30个体素簇射的生成时间不足1.2秒,优于BIB-AE在相同批量大小下的CPU性能。
  • 基于分类器的评估表明,生成样本与真实Geant4数据在统计上无法区分,所有指标的AUC值均接近0.5。
  • 该模型在CaloChallenge Dataset 3中最高达1 TeV的高能条件下仍保持高性能,表明其在不同能量尺度下具有鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。