[论文解读] Deep Learning for Sampling from Arbitrary Probability Distributions.
本文提出一种全连接神经网络,通过在训练过程中最小化Jensen-Shannon散度,学习将均匀分布随机变量映射到任意已知的一维概率分布的样本。该方法实现了高效的采样,支持独立与相关采样,并且无需解析或数值预处理即可泛化至任意分布,包括已展示的二维扩展。
This paper proposes a fully connected neural network model to map samples from a uniform distribution to samples of any explicitly known probability density function. During the training, the Jensen-Shannon divergence between the distribution of the model's output and the target distribution is minimized. We experimentally demonstrate that our model converges towards the desired state. It provides an alternative to existing sampling methods such as inversion sampling, rejection sampling, Gaussian mixture models and Markov-Chain-Monte-Carlo. Our model has high sampling efficiency and is easily applied to any probability distribution, without the need of further analytical or numerical calculations. It can produce correlated samples, such that the output distribution converges faster towards the target than for independent samples. But it is also able to produce independent samples, if single values are fed into the network and the input values are independent as well. We focus on one-dimensional sampling, but additionally illustrate a two-dimensional example with a target distribution of dependent variables.
研究动机与目标
- 开发一种基于神经网络的采样方法,绕过传统解析或数值技术,适用于任意概率分布。
- 通过单一可训练模型,实现从任意显式已知概率密度函数的高效采样。
- 通过设计支持独立与相关采样,提升蒙特卡罗应用中的收敛速度。
- 展示该方法在多维分布(包括具有依赖关系的变量)中的适用性。
- 提供一种即插即用的替代方案,用于替代反函数采样、拒绝采样、MCMC以及基于高斯混合模型的方法。
提出的方法
- 训练一个全连接前馈神经网络,将输入样本从均匀分布转换为匹配目标概率密度函数的样本。
- 训练目标是最小化模型输出分布与目标分布之间的Jensen-Shannon散度。
- 使用反向传播根据JS散度损失更新网络权重,实现采样变换的端到端学习。
- 输入噪声独立地从均匀分布中抽取,网络学习到一种确定性映射以生成所需分布的样本。
- 通过输入结构化或依赖性输入,模型可生成相关样本;通过使用独立输入,可生成独立样本。
- 通过建模具有依赖关系的变量的联合分布,将该方法扩展至二维,展示了其在单变量情况之外的泛化能力。
实验结果
研究问题
- RQ1深度神经网络是否能够有效学习从任意概率分布采样,而无需解析求逆或拒绝步骤?
- RQ2在此框架中,独立输出与相关输出的采样效率和收敛速度有何差异?
- RQ3该模型在具有依赖分量的多变量分布上能泛化到何种程度?
- RQ4最小化Jensen-Shannon散度在实践中是否能实现稳定且准确的分布匹配?
- RQ5该方法能否作为MCMC或拒绝采样等成熟采样技术的可扩展、通用替代方案?
主要发现
- 实验中观察到模型成功学习将均匀输入映射到目标分布,训练实现收敛。
- 采样效率高,因为该方法避免了传统采样中常见的迭代或拒绝步骤。
- 网络可生成相关与独立样本,其中相关采样在蒙特卡罗估计中可实现更快收敛。
- 该方法可泛化至具有依赖关系的二维分布,展示了其在单变量情况之外的可扩展性。
- 训练完成后无需额外的解析或数值计算,可直接应用于任何已知的概率密度函数。
- 该方法提供了一种通用、可微且可训练的替代方案,适用于反函数采样、拒绝采样和MCMC方法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。