Skip to main content
QUICK REVIEW

[論文レビュー] Adversarial domain adaptation to reduce sample bias of a high energy physics classifier

Jose M. Clavijo, P. C. F. Glaysher|arXiv (Cornell University)|Jan 1, 2020
Domain Adaptation and Few-Shot Learning参考文献 6被引用数 4
ひとこと要約

本論文は、LHCにおけるレアな$t\bar{t}H$(H→bb)信号の高エネルギー物理学的イベント分類におけるサンプルバイアスを低減するため、勾配反転層を備えたドメイン adversarial ニューラルネットワーク(DANN)を提案する。信号対バックグラウンドを分類する共有特徴抽出器を同時に訓練し、2つのモンテカルロ(MC)バックグラウンドモデル間のドメイン差を敵対的に最小化することで、バックグラウンドシミュレーションの選択によるモデルバイアスを軽減し、信号純度の不確実性を50%の信号効率で47%から0.3%に削減する。

ABSTRACT

We apply adversarial domain adaptation to reduce sample bias in a classification machine learning algorithm. We add a gradient reversal layer to a neural network to simultaneously classify signal versus background events, while minimising the difference of the classifier response to a background sample using an alternative MC model. We show this on the example of simulated events at the LHC with $t\bar{t}H$ signal versus $t\bar{t}b\bar{b}$ background classification.

研究の動機と目的

  • 特定のモンテカルロ(MC)バックグラウンドシミュレーションに依存することによって高エネルギー物理学の分類器に生じる顕著なバイアスに対処すること。
  • あるMCバックグラウンドモデルで訓練したモデルを、異なる実世界データまたは代替MCバックグラウンドモデルに適用した際の分類器性能の低下を軽減すること。
  • 分類性能を保持しつつ、元のバックグラウンドモデルへの依存度を最小化するドメイン適応手法を開発すること。
  • ラベル付きターゲットデータに依存せずに、実衝突データへの非教師付き適応を可能にすること。
  • 複雑で高次元の物理学データにおける敵対的ドメイン適応のハイパーパramータ感受性および訓練安定性を調査すること。

提案手法

  • 共有特徴抽出器と2つの別々のブランチ(信号/バックグラウンド分類用とドメイン分類用:バックグラウンドモデル)を持つ深層ニューラルネットワークを用いる。
  • 特徴抽出器とドメイン分類器の間に勾配反転層を導入し、逆方向に勾配をバックプロパゲートすることで、ドメイン不変表現を促進する。
  • 2つの異なるMCバックグラウンドモデル(ソースドメイン)からのラベル付き信号/バックグラウンドイベントを教師ありで訓練しながら、敵対的損失によるドメイン分類器の精度を最小化する。
  • ラベル付きターゲットデータを必要としない手順を用いて、勾配反転重み$\lambda$を含むハイパーパramータを最適化する。
  • 訓練安定性と収束性を向上させるために、ドメイン分類器に線形活性化関数と損失関数を使用する。
  • 信号純度、中央値の有意水準、ROC曲線下の面積といった物理学的に意味のある指標を用いて、さまざまな信号効率における性能を評価する。

実験結果

リサーチクエスチョン

  • RQ1敵対的ドメイン適応は、高エネルギー物理学におけるMCバックグラウンドモデル間の差異によって生じる分類器バイアスを効果的に低減できるか?
  • RQ2特に勾配反転重み$\lambda$を含むハイパーパramータの選択が、分類性能とドメイン不変性のトレードオフにどのように影響するか?
  • RQ3ラベル付きターゲットデータが存在しない状況でも、分類性能をどの程度維持しながらドメイン不変性を達成できるか?
  • RQ4勾配反転層によって引き起こされる主な訓練安定性の問題は何か、そしてそれらをどのように緩和できるか?
  • RQ5信号対バックグラウンド比が異なる場合のラベル分布シフト(例えば、ソースとターゲットドメインの信号対バックグラウンド比の違い)に対処できるか?

主な発見

  • 本手法により、50%の信号効率におけるバックグラウンドモデル選択に起因する信号純度の不確実性が47%から0.3%にまで削減され、分析感度が顕著に向上した。
  • ドメイン適応を用いて訓練された分類器は、トレーニング時に使用したバックグラウンドモデルにほぼ依存せず、ターゲットドメインにおいても高い分類性能を維持した。
  • ドメイン分類器に線形活性化関数と損失関数を使用することで、非線形代替手法と比較して訓練安定性と収束性が顕著に向上した。
  • 勾配反転層は訓練の不安定性を引き起こすが、ハイパーパramータの慎重なチューニングとドメインヘッドにおける線形部の使用により緩和された。
  • 実データにおける信号対バックグラウンド比の正確な推定がなければ、ラベル分布シフトのためわずかな残存バイアスが生じる可能性があり、実世界への展開における主な制限要因を示している。
  • 現在の手法は、非教師付き適応のための正確な信号対バックグラウンド比の推定に依存している。今後の研究では、追加の敵対的ブランチを用いてドメイン分類器からラベル情報を除去することで、ラベルシフトに対処する方法が検討されるべきである。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。