Skip to main content
QUICK REVIEW

[论文解读] Semantics for probabilistic programming: higher-order functions, continuous distributions, and soft constraints

Sam Staton, Hongseok Yang|arXiv (Cornell University)|Jan 19, 2016
Logic, Reasoning, and Knowledge参考文献 31被引用 40
一句话总结

本文提出了一种用于支持连续分布和软约束的高阶概率编程语言的形式语义,通过函子范畴解决测度论中函数空间的范畴论挑战。它建立了可靠、充分且终止的运行时与语义模型,使顺序蒙特卡洛等推理算法及编译器优化的正式验证成为可能。

ABSTRACT

We study the semantic foundation of expressive probabilistic programming languages, that support higher-order functions, continuous distributions, and soft constraints (such as Anglican, Church, and Venture). We define a metalanguage (an idealised version of Anglican) for probabilistic computation with the above features, develop both operational and denotational semantics, and prove soundness, adequacy, and termination. They involve measure theory, stochastic labelled transition systems, and functor categories, but admit intuitive computational readings, one of which views sampled random variables as dynamically allocated read-only variables. We apply our semantics to validate nontrivial equations underlying the correctness of certain compiler optimisations and inference algorithms such as sequential Monte Carlo simulation. The language enables defining probability distributions on higher-order functions, and we study their properties.

研究动机与目标

  • 为支持高阶函数、连续分布和软约束的表达性概率编程语言提供一个形式化、数学严谨的基础。
  • 解决在标准范畴论下可测空间不支持函数空间这一基础性问题,该问题阻碍了概率理论中的高阶语义。
  • 构建运行时与语义模型,确保二者之间可靠且充分,以保证计算与逻辑的一致性。
  • 支持对推理算法(如顺序蒙特卡洛)和概率程序中编译器优化的正确性进行正式推理。

提出的方法

  • 引入一种基于Anglican的元语言,通过`samples`、`score`和`norm`原语支持高阶函数、连续分布和软约束。
  • 使用在可测配置上的随机标记转移系统来建模运行时语义,将离散概率转移扩展至连续情形。
  • 通过在可测空间上的函子范畴构造行为良好的函数空间,克服可测空间无法构成笛卡尔闭范畴的问题。
  • 将Giry单子提升至函子范畴,以在高阶设置中解释连续分布和概率测度。
  • 引入密度类型`D(D)`表示连续概率密度,其求值函数与分布函数保持可测性。
  • 证明语义模型相对于运行时语义的可靠性和充分性,从而支持程序的等式推理。

实验结果

研究问题

  • RQ1在可测空间不支持函数空间的概率设定中,高阶函数应如何有意义地解释?
  • RQ2具有连续分布和软约束的概率程序的可靠且充分的运行时语义是什么?
  • RQ3如何使用范畴论构建支持函数类型和连续测度的高阶概率程序的语义模型?
  • RQ4能否使用所提出的语义形式化验证关键程序等式(如顺序蒙特卡洛模拟的基础等式)?
  • RQ5如何在不依赖完整高阶范畴工具的情况下,正式集成基于概率密度的软约束?

主要发现

  • 本文成功利用函子范畴构建了高阶概率程序的语义模型,解决了可测空间无法构成笛卡尔闭范畴这一基础性问题。
  • 语义模型被证明相对于运行时语义具有可靠性和充分性,从而支持对程序等价性与正确性的正式推理。
  • 该语义支持对顺序蒙特卡洛模拟的关键等式进行形式化验证,证实其在模型中的正确性。
  • 基于概率密度的软约束可通过密度类型`D(D)`与求值函数`ev`编码,而无需使用完整的高阶范畴工具。
  • 该语义支持嵌套查询与通过`norm`的归一化,从而以原则化方式支持后验推断。
  • 该模型同时支持离散与连续分布,包括狄拉克测度(例如`norm(return(42.0))`),并能处理后验无连续密度的情形。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。