[论文解读] Hierarchical Implicit Models and Likelihood-Free Variational Inference
论文提出分层隐式模型(HIMs)和无似然变分推断(LFVI),使基于仿真器的和隐式密度模型中的贝叶斯推断变得可扩展,应用于生态学仿真器、Bayesian GANs和深度序列模型。
Implicit probabilistic models are a flexible class of models defined by a simulation process for data. They form the basis for theories which encompass our understanding of the physical world. Despite this fundamental nature, the use of implicit models remains limited due to challenges in specifying complex latent structure in them, and in performing inferences in such models with large data sets. In this paper, we first introduce hierarchical implicit models (HIMs). HIMs combine the idea of implicit densities with hierarchical Bayesian modeling, thereby defining models via simulators of data with rich hidden structure. Next, we develop likelihood-free variational inference (LFVI), a scalable variational inference algorithm for HIMs. Key to LFVI is specifying a variational family that is also implicit. This matches the model's flexibility and allows for accurate approximation of the posterior. We demonstrate diverse applications: a large-scale physical simulator for predator-prey populations in ecology; a Bayesian generative adversarial network for discrete data; and a deep implicit model for text generation.
研究动机与目标
- 定义将隐式密度与分层贝叶斯结构耦合的分层隐式模型。
- 开发使用隐式变分族和密度比估计的无似然变分推断(LFVI)。
- 实现对大规模隐式模型和仿真器的可扩展、数据有效的贝叶斯推断。
- 展示在生态学的 Lotka-Volterra 仿真器、Bayesian GANs 和深度隐式序列模型中的应用。
提出的方法
- 将HIMs定义为分层模型,其中数据生成过程是一个仿真器,通过确定性函数 g,在带有噪声 epsilon 的情况下从 z 和 beta 生成 x。
- 引入使用隐式变分族和比率估计来近似 KL 目标函数的 LFVI,而不需要可处理的密度。
- 使用通过合适评分准则(如对数损失)训练的比率估计网络 r(x,z,beta),来估计 ELBO 所需的对数密度比 p/q。
- 采用可重参数化的变分近似来对全局变量和局部变量进行近似,以实现可微、随机梯度优化。
- 给出一个黑盒算法(Algorithm 1),通过小批量随机梯度交替更新比率估计器和变分参数。
- 展示对大数据集的可扩展性以及对离散数据和连续数据的适用性。
实验结果
研究问题
- RQ1分层隐式模型是否能够支持丰富的潜在结构,同时保持对可扩展、无似然推断的可行性?
- RQ2在似然不可解析但可以进行仿真时,我们如何进行准确的变分推断?
- RQ3无似然变分推断是否可扩展到大数据和复杂的隐式模型(例如 GANs、生态仿真器、注入噪声的 RNNs)?
主要发现
| 模型 + 推断 | Crabs | Pima | Covertype | MNIST |
|---|---|---|---|---|
| Bayesian GAN + VI | 0.03 | 0.232 | 0.154 | 0.0136 |
| Bayesian GAN + MAP | 0.12 | 0.240 | 0.185 | 0.0283 |
| Bayesian NN + VI | 0.02 | 0.242 | 0.164 | 0.0311 |
| Bayesian NN + MAP | 0.05 | 0.320 | 0.188 | 0.0623 |
- LFVI 通过使用密度比估计和隐式变分族实现对 HIMs 的可扩展推断。
- 带权重先验的 Bayesian GAN 在多个数据集上与贝叶斯神经网络相比具有竞争力。
- Lotka-Volterra 捕食者-猎物仿真器的学习在准确性和规模上都优于基于 ABC 的方法。
- 向隐藏单元注入噪声可得到可生成与上下文无关文法对齐的深度隐式序列模型。
- BFI 方法在小到中等规模数据集上展示了有竞争力的预测性能(如 Crabs、Pima、Covertype、MNIST)。
- 在大规模现实应用中,比率估计方法仍是一个需要实际考虑的问题,存在稳定性方面的顾虑。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。