QUICK REVIEW

[論文レビュー] Fast $ε$-free Inference of Simulation Models with Bayesian Conditional Density Estimation

George Papamakarios, Iain Murray|arXiv (Cornell University)|May 20, 2016

Markov Chains and Monte Carlo Methods被引用数 151

ひとこと要約

本論文は、データを与えられたパラメータのパラメトリックベイズ条件付き密度を学習する尤度なし推論法を提案し、シミュレーションを導く提案事前分布と後方を近似するベイズMDNを用いてε-free推論を可能にし、従来のABC法を超える。

ABSTRACT

Many statistical models can be simulated forwards but have intractable likelihoods. Approximate Bayesian Computation (ABC) methods are used to infer properties of these models from data. Traditionally these methods approximate the posterior over parameters by conditioning on data being inside an $ε$-ball around the observed data, which is only correct in the limit $ε\! ightarrow\!0$. Monte Carlo methods can then draw samples from the approximate posterior to approximate predictions or error bars on parameters. These algorithms critically slow down as $ε\! ightarrow\!0$, and in practice draw samples from a broader distribution than the posterior. We propose a new approach to likelihood-free inference based on Bayesian conditional density estimation. Preliminary inferences based on limited simulation data are used to guide later simulations. In some cases, learning an accurate parametric representation of the entire true posterior distribution requires fewer model simulations than Monte Carlo ABC methods need to produce a single sample from an approximate posterior.

研究の動機と目的

尤度が求めにくいシミュレータベースモデルに対する推論の動機づけと、正確な事後不確実性の必要性。
ε近似を避け、直接的な事後評価を可能にするパラメトリック後方推定量の導入。
実用的な訓練ループを開発し、提案事前分布を用いて妥当なパラメータ領域にシミュレーションを集中させる。
頑健性を向上させ、必要なシミュレーション数を削減するためベイズ的ニューラル密度推定器を活用。
複数の実験を通じて、従来のABCベースラインに対する効率と精度の向上を示す。

提案手法

出力がデータxに条件付けられたMixture Density Network (MDN)を用いて、直接 p(θ|x) を条件付き密度推定する。
シミュレーションを導く提案事前分布 ṗ(θ) を採用し、真の後方を近似するよう反復的に更新して、効率的なデータ収集を実現する。
尤度式 p̂(θ|x_o) ∝ [p(θ)/ṗ(θ)] qφ(θ|x_o) によって後方を推定する。ここで qφ は、模擬ペア (θ_n, x_n) に対して最大対数推定で訓練される。
入力を x、出力を θ として、K 個のガウス成分と完全にパラメータ化された共分散を持つMDNとして qφ を訓練する。
データが反復あたり限られている場合の訓練の頑健性を向上させるため、Bayesian MDN（MDN-SVI）を用いる。
任意で、以前の反復で学習した成分を用いて qφ を初期化し、アルゴリズム2をブートストラップする。

実験結果

リサーチクエスチョン

RQ1ε近似に依存せずに、尤度なし設定でパラメトリック条件付き密度推定量が厳密な後方 p(θ|x) を回復できるか。
RQ2妥当な θ領域に集中させる学習済みの提案事前分布は、正確な後方学習に必要なシミュレーションが減るか。
RQ3MDNとMDN-SVIの設定は、従来のABCベースラインと比べて精度とシミュレーション効率の点でどう違うか。
RQ4ε-free推論における安定性と頑健性のためのベイズ神経密度推定器の実用的利点は何か。
RQ5Lotka–Volterra, M/G/1, 線形回帰の実験で示されるように、提案フレームワークは異なるモデルタイプと次元性にスケーラブルか。

主な発見

MDNベースの事後は非ガウス分布や長尾の事後を、 rejection ABC よりも正確に回復し、競合するABCベースラインと同等以上である。
前の事後に導かれた提案事前分布を使用すると、 prior-only 訓練やABC法と比較して必要なシミュレーションが大幅に削減される。
MDN-SVI は過学習に対する頑健性を提供し、検証セットを必要としないため、効率的な小サンプル訓練を実現する。
提案事前分布の逐次的精練により、妥当な領域にシミュレーションを集約し、効率を向上させ、時には必要なモデル評価を1桁削減することもある。
実験全体を通じて、MDNおよびMDN-SVIの構成は、事後の精度とシミュレーション効率の点でABCベースラインを上回る。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。