QUICK REVIEW

[論文レビュー] Approximating Likelihood Ratios with Calibrated Discriminative Classifiers

K. Cranmer, Juan Pavez|arXiv (Cornell University)|Jun 6, 2015

Gaussian Processes and Bayesian Inference参考文献 25被引用数 131

ひとこと要約

この論文では、尤度関数が評価不能または利用できないような尤度フリー推論設定において、一般化尤度比検定を近似する手法を提案している。主な貢献は、尤度比が単調な次元削減に対して不変であることであり、これにより尤度の直接評価や事前分布を必要とせずに、1次元の分類器スコアによる効率的な近似が可能になる。

ABSTRACT

In many fields of science, generalized likelihood ratio tests are established tools for statistical inference. At the same time, it has become increasingly common that a simulator (or generative model) is used to describe complex processes that tie parameters $θ$ of an underlying theory and measurement apparatus to high-dimensional observations $\mathbf{x}\in \mathbb{R}^p$. However, simulator often do not provide a way to evaluate the likelihood function for a given observation $\mathbf{x}$, which motivates a new class of likelihood-free inference algorithms. In this paper, we show that likelihood ratios are invariant under a specific class of dimensionality reduction maps $\mathbb{R}^p \mapsto \mathbb{R}$. As a direct consequence, we show that discriminative classifiers can be used to approximate the generalized likelihood ratio statistic when only a generative model for the data is available. This leads to a new machine learning-based approach to likelihood-free inference that is complementary to Approximate Bayesian Computation, and which does not require a prior on the model parameters. Experimental results on artificial problems with known exact likelihoods illustrate the potential of the proposed method.

研究の動機と目的

高エネルギー物理学で一般的な複雑なシミュレータにおいて、尤度関数が評価不能または利用できない状況で一般化尤度比検定を実行する課題に対処すること。
モデルパrameterに事前分布を必要とせず、頻度主義枠組み内で動作する、近似ベイズ計算（ABC）の機械学習ベースの代替手法を開発すること。
尤度比がスカラーのスコアへの単調な次元削減に対して不変であるという理論的基盤を確立し、分類による効率的な近似を可能にすること。
校正済みの識別的分類器が、高次元データ設定における一般化尤度比検定の検定統計量の有効な代理として機能できることを示すこと。

提案手法

尤度比が高次元データ空間 ℝᵖ から1次元スコア空間 ℝ への単調変換に対して不変であるという性質を活用し、複雑な尤度比推定を単変量密度推定に簡略化する。
2つのパラメータ設定（θ₀ と θ₁）からのシミュレートデータを用いて、スカラーのスコア s(𝐱) を出力する識別的分類器を訓練する。このスコアは尤度比の情報を保持する。
尤度比は、分類器スコアの単変量密度比によって近似される：λ′(𝒟;θ₀,θ₁) = ∏ₓ∈𝒟 pᵤ(u=s(𝐱)|θ₀) / pᵤ(u=s(𝐱)|θ₁)，ここで u は分類器の出力である。
校正は、特定の θ 値でシミュレータからデータを生成し、カーネル密度推定法などの手法を用いて単変量密度 pᵤ(u|θ) を推定することで実施される。
分類器の訓練（識別力の向上）と校正（統計的精度）を分離し、各コンponentを独立に最適化できる。
複合仮説への拡張は、検定統計量を分類器スコアの関数と見なすことで行われ、事前分布を必要とせず頻度主義的推論が可能になる。

実験結果

リサーチクエスチョン

RQ1尤度関数が評価不能な状況において、識別的分類器を用いて一般化尤度比統計量を近似できるか？
RQ2尤度比が高次元データから1次元スコアへの単調な次元削減に対して不変であるか？これにより効率的な近似が可能か？
RQ3校正済み分類器は、モデルパrameterに事前分布を必要とせず、尤度フリー推論において近似ベイズ計算（ABC）の有効な代替手段となるか？
RQ4既知の尤度が与えられる合成設定において、分類器ベースの尤度比近似の性能は、正確な尤度比検定と比べてどの程度か？

主な発見

尤度比は ℝᵖ から ℝ への単調変換に対して不変であり、高次元データをスカラーの分類器スコアに単純化しても統計的パワーを損なわずに済む。
本手法により、尤度の直接評価を必要とせず、校正済みの分類器スコアを用いて尤度フリー設定で一般化尤度比検定を実行できる。
既知の正確な尤度が与えられる人工問題に対する実験結果から、分類器ベースの近似が真の尤度比と非常に近いことが示され、高い正確性と信頼性を示した。
本手法は頻度主義的推論と互換性があり、モデルパrameterに事前分布を指定する必要がないため、複雑なシミュレータにおける古典的統計的検定に適している。
識別的特徴の学習と校正を分離することで、最先端の分類モデルの使用が可能になるとともに、スコアの密度推定を適切に行うことで統計的妥当性を保証できる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。