QUICK REVIEW

[论文解读] Likelihood-free Markov chain Monte Carlo

Scott A. Sisson, Yanan Fan|arXiv (Cornell University)|Jan 13, 2010

Markov Chains and Monte Carlo Methods参考文献 31被引用 84

一句话总结

本文提出了一种无似然函数的马尔可夫链蒙特卡洛（LF-MCMC）方法，用于在似然函数难以计算或计算成本过高的模型中进行贝叶斯推断。通过使用模拟数据对比来替代显式的似然函数评估，该方法实现了基于MCMC的高效后验抽样，通过核加权的摘要统计量和自适应带宽，在模型拟合与误差评估方面表现出色。

ABSTRACT

To appear to MCMC handbook, S. P. Brooks, A. Gelman, G. Jones and X.-L. Meng (eds), Chapman & Hall.

研究动机与目标

引入扩展后验模型 $\pi_{LF}(\theta, x|y) \propto \pi(y|x,\theta)\pi(x|\theta)\pi(\theta)$，其中 $x$ 是从模型中生成的模拟数据集。
使用核函数 $K$ 根据模拟摘要统计量 $T(x)$ 与观测摘要统计量 $T(y)$ 之间的相似性对后验进行加权，采用自适应带宽 $\epsilon_r$。
应用Metropolis-Hastings算法从近似后验 $\pi_{LF}(\theta|y)$ 中抽样，其提议分布依赖于当前状态以及 $T(x)$ 与 $T(y)$ 之间的核加权距离。
通过 $\tau_r = T_r(x) - T_r(y)$ 建立误差建模，并采用拉普拉斯先验 $\pi(\tau_r) = \exp(-|\tau_r|/\delta_r)/(2\delta_r)$ 来评估模型拟合效果并检测模型误设。
使用双权（四次）核函数，带宽由 $S=50$ 个模拟数据集中 $T_r(x^s) - T_r(y)$ 的四分位距的两倍确定。
通过50,000次MCMC迭代执行后验推断，以估计 $\pi_{LF}(\theta|y)$ 并评估误差 $\tau$ 的边际后验分布。

伽马模型对观测数据的拟合更好，因为联合后验误差分布 $\tau|y$ 以原点为中心，50%边际高密度区域为 $\tau_1|y \sim [-0.51, 0.53]$ 和 $\tau_2|y \sim [-0.44, 0.22]$。
指数模型显示出误设迹象，因为联合后验误差分布 $\tau|y$ 并未完全以零向量为中心，其边际50%区域为 $\tau_1|y \sim [-0.32, 1.35]$ 和 $\tau_2|y \sim [-0.55, 0.27]$。
基于四分位距的自适应带宽显著提高了核加权近似在LF-MCMC算法中的鲁棒性和效率。
该方法通过基于模拟的似然替代成功近似了真实后验 $\pi(\theta|y)$，并在50,000次MCMC迭代中展示了收敛性。
通过误差分布 $\tau_r$ 进行的后预测检查为无似然函数推断中的模型拟合评估提供了一种定量诊断工具。
序列蒙特卡洛和基于回归的方法显示出在效率上优于标准MCMC的潜力，尽管仍需进一步研究以优化性能。

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。