Skip to main content
QUICK REVIEW

[論文レビュー] Estimating Ratios of Normalizing Constants Using Linked Importance Sampling

Radford M. Neal|ArXiv.org|Nov 8, 2005
Gaussian Processes and Bayesian Inference参考文献 14被引用数 50
ひとこと要約

この論文は、ベイズ統計および統計物理学における正規化定数の比を推定するための手法として、連結重要度サンプリング(LIS)を導入する。中間分布の系列における各段階でブリッジサンプリングに類似した推定を用いることで、特に軽尾分布やレアイベントを含む問題において、アンネールド重要度サンプリング(AIS)よりも著しく高い精度を達成する一方で、マルコフ連鎖が平衡に達していない場合でも正確な不偏性を維持する。

ABSTRACT

Ratios of normalizing constants for two distributions are needed in both Bayesian statistics, where they are used to compare models, and in statistical physics, where they correspond to differences in free energy. Two approaches have long been used to estimate ratios of normalizing constants. The `simple importance sampling' (SIS) or `free energy perturbation' method uses a sample drawn from just one of the two distributions. The `bridge sampling' or `acceptance ratio' estimate can be viewed as the ratio of two SIS estimates involving a bridge distribution. For both methods, difficult problems must be handled by introducing a sequence of intermediate distributions linking the two distributions of interest, with the final ratio of normalizing constants being estimated by the product of estimates of ratios for adjacent distributions in this sequence. Recently, work by Jarzynski, and independently by Neal, has shown how one can view such a product of estimates, each based on simple importance sampling using a single point, as an SIS estimate on an extended state space. This `Annealed Importance Sampling' (AIS) method produces an exactly unbiased estimate for the ratio of normalizing constants even when the Markov transitions used do not reach equilibrium. In this paper, I show how a corresponding `Linked Importance Sampling' (LIS) method can be constructed in which the estimates for individual ratios are similar to bridge sampling estimates. I show empirically that for some problems, LIS estimates are much more accurate than AIS estimates found using the same computation time, although for other problems the two methods have similar performance. Linked sampling methods similar to LIS are useful for other purposes as well.

研究の動機と目的

  • ベイズ推論および統計物理学における正規化定数の比を推定するための、アンネールド重要度サンプリング(AIS)のより正確な代替手法を開発すること。
  • 分布の重なりが悪い、もしくは裾が重たい場合に、単純な重要度サンプリングおよびブリッジサンプリングの限界を克服すること。
  • マルコフ連鎖の遷移が平衡に達していない場合でも、正確な不偏性を保つ手法を構築すること。
  • 中間分布をブリッジサンプリング推定で連結することで、AISに比べて推定効率が向上するかどうかを検討すること。
  • 高次元または多次元モードを持つ設定において、LISがAISを上回る条件を調査すること。

提案手法

  • 各隣接分布間の比推定に単純な重要度サンプリングの代わりにブリッジサンプリングのアプローチを用いる、AISの変種として連結重要度サンプリング(LIS)を提案する。
  • ターゲット分布π0とπ1を結ぶ中間分布の系列をηjでパラメータ化し、それらの間の遷移をメトロポリス・ハスティングス法で制御する。
  • 現在の分布状態と次の分布状態の両方を含む拡張された状態空間上で同時サンプリングを行うことで、比の積の不偏推定を保証する。
  • エネルギー差に基づいて、拡張された空間内での状態間遷移の受容確率を導出する。その形式はexp(−(ηj+1−ηj)(U(x,y1)−U(x,y0)))である。
  • 各段階でのマルコフステップ数Kjを適応可能とする柔軟な枠組みを導入し、高エネルギー状態から低エネルギー状態への複数回の「ツアー」を実行することで、サンプリング品質の向上が期待できると提言する。
  • 各中間分布に対して1回の遷移のみを許容するように方法を拡張し、AISに類似した滑らかな推定を実現するとともに、ブリッジサンプリング部の導入により分散制御を改善する。

実験結果

リサーチクエスチョン

  • RQ1中間分布の系列における各段階でブリッジサンプリング推定を用いる手法が、正規化定数の比推定においてAISを上回る可能性があるか?
  • RQ2LISがAISを著しく上回る条件は何か、特に高次元または多次元モードを持つ問題においては?
  • RQ3LISの上位レベルでブリッジサンプリングを用いることで、単純な重要度サンプリングに比べて推定効率がさらに向上するか?
  • RQ4AISが重なりが悪いために失敗する可能性がある軽尾分布やレアイベントの問題において、LISはどのように性能を発揮するか?
  • RQ5複数回の「ツアー」を段階ごとに実行するような適応的サンプリング戦略は、計算コストを著しく増加させることなくLISの性能を向上させられるか?

主な発見

  • マルコフ連鎖の遷移が平衡に達していない場合でも、LISは正規化定数の比に対して正確な不偏推定を生成する。
  • 軽尾分布やレアイベントを含む問題において、LISはAISよりも著しく高い精度を示す。特に、重なりを改善するために中間分布を適切に選ぶことでその効果が顕著になる。
  • 分散比が2の100次元球面ガウス分布に対するテストでは、LISとAISの性能に差がなく、ガウス設定では利点がないことが示された。
  • レアイベントを定義する制約を含む問題において、LISは特に有望である。AISはゼロ確率領域のため失敗するが、LISはより良い混合性と精度を維持する。
  • 有限個の中間分布しか利用できない場合(例えば逐次的重要度サンプリングにおいて)、LISは各ステップでの重なりの改善とより安定した推定により、AISを上回る可能性がある。
  • 多次元モードを持つ設定でもLISは頑健であり、孤立したモードを含む分布に対しても期待値の推定が可能である。AISと同様の性能を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。