Skip to main content
QUICK REVIEW

[论文解读] Resurrecting $ b\overline{b}h $ with kinematic shapes

Christophe Grojean, Ayan Paul|arXiv (Cornell University)|Jan 1, 2020
Particle physics theoretical and experimental studies参考文献 69被引用 2
一句话总结

该论文提出了一种基于可解释机器学习的运动学形状分析方法,用于在未来强子对撞机上从主导背景中分离出 $ b\bar{b}h $ 信号,从而实现对底夸克 Yukawa 耦合 $ y_b $ 的约束,包括其相位。通过将 Shapley 值应用于提升决策树(Boosted Decision Trees),该方法识别出区分 $ y_b $ 驱动的 $ b\bar{b}h $ 产生过程与 $ y_t $ 驱动及不可约背景 $ Zh $ 的关键运动学变量,在 HL-LHC 上对 $ \kappa_b $ 的灵敏度达到 2.2%,在 FCC-hh 上低于 1%。

ABSTRACT

The associated production of a $b\bar{b}$ pair with a Higgs boson could provide an important probe to both the size and the phase of the bottom-quark Yukawa coupling, $y_b$. However, the signal is shrouded by several background processes including the irreducible $Zh, Z o b\bar{b}$ background. We show that the analysis of kinematic shapes provides us with a concrete prescription for separating the $y_b$-sensitive production modes from both the irreducible and the QCD-QED backgrounds using the $b\bar{b}\gamma\gamma$ final state. We draw a page from game theory and use Shapley values to make Boosted Decisions Trees interpretable in terms of kinematic measurables and provide physics insights into the variances in the kinematic shapes of the different channels that help us complete this feat. Adding interpretability to the machine learning algorithm opens up the black-box and allows us to cherry-pick only those kinematic variables that matter most in the analysis. We resurrect the hope of constraining the size and, possibly, the phase of $y_b$ using kinematic shape studies of $b\bar{b}h$ production with the full HL-LHC data and FCC-hh.

研究动机与目标

  • 为克服未来对撞机中不可约 $ Zh $ 背景掩盖 $ b\bar{b}h $ 信号的挑战。
  • 开发一种可解释的机器学习框架,以识别信号-背景分离中最相关的运动学变量。
  • 评估利用 HL-LHC 和 FCC-hh 的 $ b\bar{b}\gamma\gamma $ 最终态测量底夸克 Yukawa 耦合 $ y_b $ 的大小和相位的可行性。
  • 为高能物理分析中提供一种物理解释性强于黑箱机器学习模型的替代方案。

提出的方法

  • 应用带有 Shapley 值的提升决策树(BDT),量化每个运动学变量对信号-背景区分的贡献。
  • 利用 Shapley 值将 BDT 决策解释为物理运动学可观测量,从而识别出最具区分力的变量。
  • 使用蒙特卡洛方法模拟 HL-LHC(6 ab⁻¹)和 FCC-hh(30 ab⁻¹)下的 $ b\bar{b}h $、$ Zh $ 以及 QCD-QED $ b\bar{b}\gamma\gamma $ 过程。
  • 对 $ b\bar{b}\gamma\gamma $ 最终态中的运动学形状进行多变量分析,以分离 $ y_b^2 $ 和 $ y_t^2 $ 驱动的贡献。
  • 构建一个包含 12 层、每层 64 个神经元的深度神经网络(DNN)混淆矩阵,以验证分类性能。
  • 通过圈修正的 Higgs 耦合关系,将有效耦合 $ \kappa_g $、$ \kappa_\gamma $ 和 $ \tilde{\kappa}_g $ 与 $ \kappa_b $ 和 $ \tilde{\kappa}_b $ 关联,用于全局 EFT 一致性检查。

实验结果

研究问题

  • RQ1基于可解释机器学习的运动学形状分析能否克服 $ b\bar{b}h $ 信号提取中不可约 $ Zh $ 背景的挑战?
  • RQ2哪些运动学变量最能区分 $ y_b $ 驱动的 $ b\bar{b}h $ 与 $ y_t $ 驱动及 $ Zh $ 贡献?
  • RQ3在 HL-LHC 和 FCC-hh 上,利用 $ b\bar{b}\gamma\gamma $ 最终态对 $ \kappa_b $ 及其 CP 破坏相位的投影灵敏度是多少?
  • RQ4理论和系统性不确定性如何影响 $ b\bar{b}h $ 通道中对 $ \kappa_b $ 的灵敏度?
  • RQ5从 $ b\bar{b}h $ 产生中可导出对 $ \kappa_b $ 和 $ \tilde{\kappa}_b $ 的哪些约束?与电偶极矩(EDM)测量结果相比如何?

主要发现

  • Shapley 值分析识别出 $ m_{bb} $、$ p_{T}^{\gamma\gamma} $、$ H_T $ 和 $ m_{b_1h} $ 是分离 $ y_b^2 $ 和 $ y_t^2 $ 贡献的最具区分力的运动学变量。
  • 在 HL-LHC(6 ab⁻¹)下,该方法对 $ \kappa_b $ 的灵敏度达到 2.2%,与 $ Vh \to b\bar{b} $ 通道的预期极限相当。
  • 在 FCC-hh(30 ab⁻¹)下,灵敏度提升至低于 1% 的 $ \kappa_b $,展示了高精度测量 $ y_b $ 耦合的潜力。
  • DNN 混淆矩阵显示,在 HL-LHC 上对五通道分离(信号、$ y_b^2 $、$ y_by_t $、$ y_t^2 $、$ Zh $)的分类准确率约为 95%。
  • 分析表明,仅靠 $ m_{bb} $ 无法实现有效区分,但其与其他变量的相关性可形成 BDT 可利用的形状特征。
  • 从 $ b\bar{b}h $ 产生中获得的对 $ \tilde{\kappa}_b $ 的约束与 EDM 测量结果具有竞争力,尤其在复数 $ \kappa_b $-相位情形下。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。