Skip to main content
QUICK REVIEW

[論文レビュー] Exact Probabilistic Inference Using Generating Functions

Lutz Klinkenberg, Tobias Winkler|arXiv (Cornell University)|Jan 1, 2023
Bayesian Modeling and Causal Inference被引用数 1
ひとこと要約

本稿では、確率母関数(PGF)を用いた記号的で正確な推論フレームワークを提示し、無限サポート分布や非有界ループを含む離散確率的プログラムにおける後方分布の正確な推論を可能にする。PGFに基づく意味論を2次PGFを用いた条件付き処理に拡張することで、自動的かつ閉形式での推論が可能となり、電話オペレーターのモデルや奇数カウント幾何分布プロセスといった、後方観測を含むプログラムにおいて実証されている。

ABSTRACT

Probabilistic programs are typically normal-looking programs describing posterior probability distributions. They intrinsically code up randomized algorithms and have long been at the heart of modern machine learning and approximate computing. We explore the theory of generating functions [19] and investigate its usage in the exact quantitative reasoning of probabilistic programs. Important topics include the exact representation of program semantics [13], proving exact program equivalence [5], and -- as our main focus in this extended abstract -- exact probabilistic inference. In probabilistic programming, inference aims to derive a program's posterior distribution. In contrast to approximate inference, inferring exact distributions comes with several benefits [8], e.g., no loss of precision, natural support for symbolic parameters, and efficiency on models with certain structures. Exact probabilistic inference, however, is a notoriously hard task [6,12,17,18]. The challenges mainly arise from three program constructs: (1) unbounded while-loops and/or recursion, (2) infinite-support distributions, and (3) conditioning (via posterior observations). We present our ongoing research in addressing these challenges (with a focus on conditioning) leveraging generating functions and show their potential in facilitating exact probabilistic inference for discrete probabilistic programs.

研究の動機と目的

  • 非有界ループや無限サポート分布を含む離散確率的プログラムにおける正確な確率的推論を可能にすること。
  • PGFに基づく意味論を条件付き処理を第一級の構文的構成要素として扱えるように拡張し、従来のサンプリングベースや有界ループに依存する手法の限界を克服すること。
  • 記号的パラメータと構成的推論をサポートするPGFを用いた自動推論エンジンを開発すること。
  • 観測文がループ内に存在する場合の正確な推論という、現在のツールにおける主要なギャップを埋めること。

提案手法

  • 離散分布を閉形式で表現するための確率母関数(PGF)を用い、ポisson や幾何分布のような無限サポート分布の正確な操作を可能にする。
  • Kozenのアプローチに倣った意味論的フレームワークを採用し、PGFを介した分布変換としてプログラムをモデル化する。
  • 条件付け後の後方分布を符号的に計算可能にするために、2次PGF(SOP)を用いて後方分布を符号化する。
  • PGFにおける構成的推論と代数的演算を活用し、モーメント、尾確率、正確な推論結果を計算する。
  • 記号的パラメータと複雑な制御フローを伴うプログラムにおける推論の自動化を実現するため、オープンソースのPRODIGYツールと統合する。
  • 非有界ループ内に条件付き処理があるプログラムへSOP技術を一般化するための文法的制限を実装する。

実験結果

リサーチクエスチョン

  • RQ1PGFは、特に観測文がループ内にネストされている場合の条件付き処理を伴う確率的プログラムにおける正確な推論を拡張できるか?
  • RQ22次PGFは、条件付け下での非有界ループと無限サポート分布を扱うように一般化可能か?
  • RQ3ループ内での条件付き処理を伴うスケーラブルで自動化された正確な推論を可能にするために、どのような文法的制限が必要か?
  • RQ4PGF表現内での記号的パラメータは、最尤推定などの最適化手法の統合を可能にするか?
  • RQ5特性関数を用いることで、PGFベースの推論を連続分布へどの程度まで拡張できるか?

主な発見

  • 電話オペレーターのプログラムでは、PRODIGYが Pr(w = 0) = 1215 / (1215 + 2·e⁴) ≈ 0.9178 を計算し、閉形式の正確な後方確率となる。
  • 奇数幾何分布のプログラムでは、後方生成関数が 3c / (4 - c²) として導出され、奇数カウントの正確な分布が符号化されている。
  • (λ)PSI や DICE とは異なり、非有界ループと無限サポート分布を正しく処理できる。
  • PGF表現内での記号的パラメータのサポートにより、将来のパラメータフィッティングや最適化との統合が可能となる。
  • 本フレームワークは推論を越えて、プログラムの同値性や非ほとんど確実な終了性に関する推論をサポートする。
  • 現在の実装は、観測文がプログラムのトップレベルにない場合でも、条件付き処理を伴うプログラムにおける正確な推論の自動化を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。