QUICK REVIEW

[論文レビュー] Sandwiching the marginal likelihood using bidirectional Monte Carlo

Roger Grosse, Zoubin Ghahramani|arXiv (Cornell University)|Nov 8, 2015

Statistical Methods and Inference参考文献 32被引用数 33

ひとこと要約

本稿では、前向きおよび逆向きのアンネーリング付き重要度サンプリングを組み合わせることで、尤度の周辺分布に対するタイトな確率的境界を計算する、双方向モンテカルロ（BDMC）を提案する。この手法により、シミュレートされたデータ上での周辺尤度の正確で定量的に検証可能な推定が可能となり、テストされた中でAIS、SMC、NSが最も信頼性の高い推定器であることが明らかになった一方、尤度重み付け法とBICは一貫して不正確であることが判明した。

ABSTRACT

Computing the marginal likelihood (ML) of a model requires marginalizing out all of the parameters and latent variables, a difficult high-dimensional summation or integration problem. To make matters worse, it is often hard to measure the accuracy of one's ML estimates. We present bidirectional Monte Carlo, a technique for obtaining accurate log-ML estimates on data simulated from a model. This method obtains stochastic lower bounds on the log-ML using annealed importance sampling or sequential Monte Carlo, and obtains stochastic upper bounds by running these same algorithms in reverse starting from an exact posterior sample. The true value can be sandwiched between these two stochastic bounds with high probability. Using the ground truth log-ML estimates obtained from our method, we quantitatively evaluate a wide variety of existing ML estimators on several latent variable models: clustering, a low rank approximation, and a binary attributes model. These experiments yield insights into how to accurately estimate marginal likelihoods.

研究の動機と目的

複雑なモデルにおける機械学習推定器の評価のための信頼できる真値周辺尤度推定値の不足に対処すること。
真の対数周辺尤度の高い確率で確率的上界および下界を提供する手法の開発。
真の値が既知のシミュレートデータを用いた、既存の周辺尤度推定器の定量的ベンチマークの実現。
クラスタリング、低ランク近似、バイナリ属性を含むさまざまな潜在変数モデルにおいて、AIS、SMC、NSなどの推定器がどれほど信頼性を持って動作するかの特定。
周辺尤度推定のための厳密な評価フレームワークを提供することで、より良い推論アルゴリズムの開発を支援すること。

提案手法

標準的な重要度サンプリングアルゴリズム（例：AIS、SMC）を前向きおよび逆向きに実行することで、対数周辺尤度の確率的下界および上界を生成する、双方向モンテカルロ（BDMC）を提案する。
アンネーリング付き重要度サンプリング（AIS）または逐次モンテカルロ（SMC）を用いて、中間分布の系列からのサンプリングにより確率的下界を生成する。
正確な事後分布サンプルから出発して同じアルゴリズムを逆向きに実行することで、確率的上界を生成する。このとき、プロセスを逆方向に実行することで、元の分布に戻る。
真の対数周辺尤度は、ほぼ確実にこれらの二つの境界の間に挟まれており、計算量が増えるにつれてギャップが小さくなる。
クラスタリング、低ランク近似、バイナリ属性を含むモデルからシミュレートデータを生成し、真値推定を可能にする。
得られた境界をゴールドスタンダードとして、ネストドサブセット（NS）、調和平均、BICなどの他の機械学習推定器の精度を評価する。

実験結果

リサーチクエスチョン

RQ1真の値が計算不能なモデルにおいて、信頼性があり定量的に検証可能な周辺尤度推定値をどのように得られるか。
RQ2AIS、SMC、ネストドサブセット、調和平均、BICといった既存の周辺尤度推定器の中で、多様な潜在変数モデルにおいてどれほど正確に動作するか。
RQ3双方向モンテカルロは、シミュレートされたデータのみを用いても、真の周辺尤度を高い確率でタイトに境界付けることができるか。
RQ4アンネーリングスケジュールや変数の統合といったアルゴリズム的選択が、周辺尤度推定の精度にどのように影響するか。
RQ5異なる推定器が、真の対数周辺尤度を系統的に過小または過大に推定する程度はどの程度で、その傾向はBDMCによって検出可能か。

主な発見

双方向モンテカルロは、十分な計算量を要すれば、真の値に収束する確率的上界および下界を的確に生成でき、高信頼性の真値推定を可能にする。
AISはクラスタリングモデルにおいて16.5分でRMSE 7.5 nats、15.1分でRMSE 9.0 natsを達成し、計算量の増加に伴い優れた性能を示した。
SMCは20.5分でRMSE 11.9 nats、69分でRMSE 4.7 natsを達成し、収束は遅いが最終的には正確な推定が可能であることが示された。
ネストドサブセット（NS）は高い分散を示し、特に計算量が限られた状況ではAISやSMCに劣った。
尤度重み付け法と調和平均推定器は一貫して不正確な推定値を出力し、後者は高い信頼性でさえも失敗した。
BICは、広く使われているにもかかわらず、すべてのテストされたモデルで信頼性がなく、系統的に不正確であることが判明した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。