QUICK REVIEW

[論文レビュー] Delayed Sampling and Automatic Rao-Blackwellization of Probabilistic Programs

Lawrence M. Murray, Daniel Lundén|arXiv (Cornell University)|Aug 25, 2017

Bayesian Modeling and Causal Inference被引用数 26

ひとこと要約

本論文は、確率的プログラミングにおける動的メカニズムとしての遅延サンプリングを導入する。この手法は、共役事前分布やアフィン関係といった解析的に扱いやすい部分構造を自動で特定し、最後までサンプリングを延期することで、順次モンテカルロ（SMC）推論におけるRao–Blackwellizationと局所最適な提案分布の実現を可能にする。この方法により、パラメータを解析的に周辺化することでモンテカルロ分散を低減でき、合成モデルおよび実世界のモデル（実データを用いたデングー熱の流行モデルを含む）において推定効率が顕著に向上することが示された。

ABSTRACT

We introduce a dynamic mechanism for the solution of analytically-tractable substructure in probabilistic programs, using conjugate priors and affine transformations to reduce variance in Monte Carlo estimators. For inference with Sequential Monte Carlo, this automatically yields improvements such as locally-optimal proposals and Rao-Blackwellization. The mechanism maintains a directed graph alongside the running program that evolves dynamically as operations are triggered upon it. Nodes of the graph represent random variables, edges the analytically-tractable relationships between them. Random variables remain in the graph for as long as possible, to be sampled only when they are used by the program in a way that cannot be resolved analytically. In the meantime, they are conditioned on as many observations as possible. We demonstrate the mechanism with a few pedagogical examples, as well as a linear-nonlinear state-space model with simulated data, and an epidemiological model with real data of a dengue outbreak in Micronesia. In all cases one or more variables are automatically marginalized out to significantly reduce variance in estimates of the marginal likelihood, in the final case facilitating a random-weight or pseudo-marginal-type importance sampler for parameter estimation. We have implemented the approach in Anglican and a new probabilistic programming language called Birch.

研究の動機と目的

動的かつ実行時における解析的扱いやすさの関係を同定することで、確率的プログラミングにおけるSMC推論における分散低減を自動化すること。
変数間の解析的関係が十分に活用されていない場合に生じる、SMCにおける非最適なモンテカルロ推定量の課題に対処すること。
モデル全体の構造を事前に把握する必要なく、共役事前分布やアフィン変換を活用した推論を可能にすること。
遅延サンプリングによるパラメータの自動周辺化によって、正確な周辺尤度推定に必要な粒子数を削減すること。
モデリングコードへの干渉を最小限に抑えつつ、確率的プログラミング言語にこのメカニズムをスムーズに統合すること。

提案手法

プログラム実行と並行して動的有向グラフを維持し、ノードを確率的変数、エッジを共役性やアフィン変換などの解析的に扱いやすい関係として定義する。
『サンプリング』のチェックポイントで確率的変数のサンプリングを延期し、それらをグラフに追加し、利用可能な観測値に基づいて解析的に条件づける。
解析的更新を用いて共役性を保持したまま、グラフ上で前向きフィルタリングを実行し、周辺化された条件付き分布を計算する。
関数に解析的オーバーロードが存在しない場合にのみ、後向きサンプリングを実行することで、変数のサンプリングを最後の瞬間まで延期する。
共役指数型分布族（例：ベータ＝二項分布、ガンマ＝ポアソン分布）の十分統計量を維持・更新することで、Rao–Blackwellizationを実現する。
SMCと統合し、局所最適な提案分布を可能にするとともに、粒子フィルタ内でのパラメータ周辺化により分散を低減する。

実験結果

リサーチクエスチョン

RQ1実行時における動的メカニズムが、確率的プログラミング内での解析的に扱いやすい関係を自動で同定・活用することで、モンテカルロ分散を低減できるか。
RQ2遅延サンプリングは、共役構造を有するモデルにおける順次モンテカルロ推論の効率をどの程度向上させるか。
RQ3同等の推定精度を達成するための粒子数という観点で、遅延サンプリングは標準的なSMCと比べてどの程度優れているか。
RQ4疫学的状態空間モデルのような複雑な実世界モデルに対しても、手動でのモデル変換を要せず、遅延サンプリングを適用できるか。
RQ5特に高次元または多次元共役設定において、遅延サンプリングの計算的トレードオフはどのようなものか。

主な発見

線形非線形状態空間モデルでは、遅延サンプリングによりパラメータを周辺化することでRao–Blackwellized SMCが実現され、尤度推定の分散が低減した。
ミクロネシアにおけるデングー熱の流行モデルでは、遅延サンプリングにより擬似周辺尤度重要度サンプリングが効率的に実行され、安定な推定に必要な粒子数が顕著に削減された。
遅延サンプリングを有効化した場合、図3（右）に示す100回のSMC実行の分布から、周辺尤度推定における同等の分散を達成するために必要な粒子数が減少した。
モデルコードの変更なしに分散低減が達成されたため、推論品質の自動的かつ透明な向上が実証された。
一変量共役族では、サンプルあたり一定の計算オーバーヘッドが生じたが、固定計算予算においてはそのコストが妥当であると判断された。
多次元正規分布の共役性のような多次元設定では、行列逆行列計算に起因するオーバーヘッドが増加し、高次元ケースでは潜在的なトレードオフが生じることが示唆された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。