Skip to main content
QUICK REVIEW

[论文解读] Exact Probabilistic Inference Using Generating Functions

Lutz Klinkenberg, Tobias Winkler|arXiv (Cornell University)|Jan 1, 2023
Bayesian Modeling and Causal Inference被引用 1
一句话总结

本文提出了一种基于概率生成函数(PGFs)的符号化、精确推理框架,用于离散概率程序,支持在存在无界循环和无限支撑分布的情况下对后验分布进行精确推理。通过将基于PGF的语义扩展至使用二阶PGF(SOP)处理条件化,该方法实现了自动化的闭式推理——在包含后验观测的程序(如电话接线员模型和奇数计数几何过程)上得到了验证。

ABSTRACT

Probabilistic programs are typically normal-looking programs describing posterior probability distributions. They intrinsically code up randomized algorithms and have long been at the heart of modern machine learning and approximate computing. We explore the theory of generating functions [19] and investigate its usage in the exact quantitative reasoning of probabilistic programs. Important topics include the exact representation of program semantics [13], proving exact program equivalence [5], and -- as our main focus in this extended abstract -- exact probabilistic inference. In probabilistic programming, inference aims to derive a program's posterior distribution. In contrast to approximate inference, inferring exact distributions comes with several benefits [8], e.g., no loss of precision, natural support for symbolic parameters, and efficiency on models with certain structures. Exact probabilistic inference, however, is a notoriously hard task [6,12,17,18]. The challenges mainly arise from three program constructs: (1) unbounded while-loops and/or recursion, (2) infinite-support distributions, and (3) conditioning (via posterior observations). We present our ongoing research in addressing these challenges (with a focus on conditioning) leveraging generating functions and show their potential in facilitating exact probabilistic inference for discrete probabilistic programs.

研究动机与目标

  • 实现对具有无界循环和无限支撑分布的离散概率程序的精确概率推理。
  • 将基于PGF的语义扩展为支持条件化作为一等构造,克服现有基于采样或有界循环方法的局限性。
  • 开发一种基于PGF的自动化推理引擎,支持符号参数和组合式推理。
  • 解决在观测语句位于循环内部时的精确推理这一开放挑战,这是当前工具中的主要空白。

提出的方法

  • 使用概率生成函数(PGFs)以闭式表示离散分布,实现对泊松和几何等无限支撑分布的精确操作。
  • 采用Kozen式的指称语义框架,将程序建模为通过PGFs表示的分布变换器。
  • 使用二阶PGF(SOP)编码条件化后的后验分布,支持对精确后验概率的符号计算。
  • 利用PGF上的组合式推理与代数运算,计算矩、尾部界和精确推理结果。
  • 与开源工具PRODIGY集成,实现对具有符号参数和复杂控制流的程序的推理自动化。
  • 实施语法限制,将SOP技术推广至包含无界循环中条件化的程序。

实验结果

研究问题

  • RQ1PGF能否被扩展以支持在条件化下(特别是观测语句嵌套于循环中)的概率程序的精确推理?
  • RQ2二阶PGF如何推广以处理在条件化下具有无界循环和无限支撑分布的情况?
  • RQ3何种语法限制可实现具有循环条件化的程序中可扩展的、自动化的精确推理?
  • RQ4符号参数能否在PGF表示中有效使用,以支持最大似然估计等优化技术?
  • RQ5PGF-based推理在何种程度上可借助特征函数推广至连续分布?

主要发现

  • 对于电话接线员程序,PRODIGY计算得 Pr(w = 0) = 1215 / (1215 + 2·e⁴) ≈ 0.9178,为闭式精确后验概率。
  • 对于奇数几何分布程序,后验生成函数被推导为 3c / (4 - c²),精确编码了奇数计数上的分布。
  • 该方法成功处理了无界循环和无限支撑分布,而(λ)PSI和DICE则需有界循环。
  • 该方法在PGF表示中支持符号参数,为未来集成参数拟合与优化铺平道路。
  • 该框架不仅支持推理,还可用于程序等价性和非几乎必然终止性的推理。
  • 当前实现已证明可在观测语句不在程序顶层时,自动化实现具有条件化的程序的精确推理。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。