QUICK REVIEW

[論文レビュー] Approximate Bayesian inference from noisy likelihoods with Gaussian process emulated MCMC

Marko Järvenpää, Jukka Corander|arXiv (Cornell University)|Apr 8, 2021

Gaussian Processes and Bayesian Inference被引用数 3

ひとこと要約

本稿では、尤度評価がノイズが多く計算コストが高価な状況において、マルコフ連鎖モンテカルロ（MCMC）サンプリングを高速化するための新しい近似ベイズ推論フレームワーク、GP-MHを提案する。尤度評価の点を局所的な実験計画法により段階的に選択することで、GP-MHは正確なメトロポリス・ハスティングス（MH）サンプラーの進行をエミュレートし、1,000回未満の対数尤度評価で高いサンプル効率と頑健性を達成した。これは、尤度フリー推論の文脈において、既存手法を上回る優れた性能を示している。

ABSTRACT

We present a framework for approximate Bayesian inference when only a limited number of noisy log-likelihood evaluations can be obtained due to computational constraints, which is becoming increasingly common for applications of complex models. We model the log-likelihood function using a Gaussian process (GP) and the main methodological innovation is to apply this model to emulate the progression that an exact Metropolis-Hastings (MH) sampler would take if it was applicable. Informative log-likelihood evaluation locations are selected using a sequential experimental design strategy until the MH accept/reject decision is done accurately enough according to the GP model. The resulting approximate sampler is conceptually simple and sample-efficient. It is also more robust to violations of GP modelling assumptions compared with earlier, related "Bayesian optimisation-like" methods tailored for Bayesian inference. We discuss some theoretical aspects and various interpretations of the resulting approximate MH sampler, and demonstrate its benefits in the context of Bayesian and generalised Bayesian likelihood-free inference for simulator-based statistical models.

研究の動機と目的

尤度評価が計算コストが高くノイズが多い、特にシミュレータベースのモデルにおいてベイズ推論を実行する課題に対処すること。
高次元または単峰性の事後分布設定において、グローバルなGPサーヴィェイランスモデルの非効率性を克服すること。
尤度フリー推論のアクティブラーニング戦略において、獲得関数の高価なグローバル最適化に依存しないようにすること。
正確なMCMCをGPモデルを用いてエミュレートしつつ、頑健性とサンプル効率を維持する手法を開発すること。
尤度フリー推論におけるベイズ最適化に類似した手法の理論的裏付けをもつ、サンプル効率の高い代替手法を提供すること。

提案手法

事後密度の確率的近似を可能にするために、対数尤度関数をガウス過程（GP）でモデル化する。
GPモデルの予測分散と不確実性に基づいて、情報量の多い尤度評価位置を選択するための逐次的実験計画戦略を用いる。
GPを用いて候補パラメータ値における受容／拒否意思決定を予測することで、正確なメトロポリス・ハスティングス（MH）サンプラーの進行をエミュレートする。
最高事後密度領域に焦点を当てた局所的探索戦略を適用し、パラメータ境界付近での重複評価を回避する。
評価収集のためのしきい値ベースの停止基準を適用し、MH意思決定における十分な精度を確保した上で終了する。
より高いサンプル効率を実現するための新規獲得関数、EPoE（期待誤差確率）を用いる。

実験結果

リサーチクエスチョン

RQ1GPベースのMHサンプラーのエミュレーションは、正確なMCMCに比べて著しく少ない尤度評価回数で、正確な事後分布近似を達成できるか？
RQ2ノイズの多い尤度下で、BLFI や BOLFI といった既存手法と比較して、GP-MHのサンプル効率と正確性はどの程度優れているか？
RQ3高次元または単峰性の事後分布状況において、局所的でMHに従う実験計画戦略は、グローバル獲得関数を上回る性能を示すか？
RQ4複雑で非線形なモデルにおいて、GPモデリングの仮定の違反に対して、GP-MHはどの程度頑健性を保っているか？
RQ5高いノイズレベルを有する合成尤度法で推定される尤度を、GP-MHは効果的に処理できるか？

主な発見

GP-MHは、すべてのテストケースで1,000回未満の対数尤度評価で高い事後分布近似の正確性を達成し、103回評価のしきい値を一貫して満たした。
GP-MHにおけるEPoEに基づく評価選択は、ナーブおよびEPoEr戦略に比べて優れたサンプル効率を示し、IMIQRを用いたBLFIと同等またはより高い正確性を達成した。
リッカー・モデルの実験では、EPoEを用いたGP-MHが、両方の周辺分布および相関構造の正確な事後推定を達成し、MH-BLFIと同等の性能を示した。
本手法はノイズの多い尤度に対して頑健であり、先行研究のヒューリスティック獲得関数とは異なり、パラメータ境界付近での重複評価を回避した。
シータ-リッカー・モデルでは、EPoEがナーブおよびEPoErに比べて、より均等に分布し多様性のある評価位置を生成し、より優れた探索を示した。
時間経過に伴う評価収集の割合は安定した収束を示し、100回の繰り返し実験において中央値および75百分位数のトレンドが、信頼性と一貫性のある性能を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。