Skip to main content
QUICK REVIEW

[论文解读] Random Feature Stein Discrepancies

Jonathan H. Huggins, Lester Mackey|arXiv (Cornell University)|Jun 20, 2018
Adversarial Robustness in Machine Learning被引用 26
一句话总结

本文提出了特征 Stein 偏差(ΦSDs),这是一种新型的可计算 Stein 偏差家族,可严格确定样本收敛到目标分布。通过利用带随机特征的重要性采样,作者提出了随机 ΦSDs(RΦSDs),在保持与二次时间核 Stein 偏差(KSDs)相当的精度的同时,实现接近线性 O(N^{1+γ}) 的计算时间,从而实现快速、可扩展的拟合优度检验和采样器选择。

ABSTRACT

Computable Stein discrepancies have been deployed for a variety of applications, ranging from sampler selection in posterior inference to approximate Bayesian inference to goodness-of-fit testing. Existing convergence-determining Stein discrepancies admit strong theoretical guarantees but suffer from a computational cost that grows quadratically in the sample size. While linear-time Stein discrepancies have been proposed for goodness-of-fit testing, they exhibit avoidable degradations in testing power -- even when power is explicitly optimized. To address these shortcomings, we introduce feature Stein discrepancies ($Φ$SDs), a new family of quality measures that can be cheaply approximated using importance sampling. We show how to construct $Φ$SDs that provably determine the convergence of a sample to its target and develop high-accuracy approximations -- random $Φ$SDs (R$Φ$SDs) -- which are computable in near-linear time. In our experiments with sampler selection for approximate posterior inference and goodness-of-fit testing, R$Φ$SDs perform as well or better than quadratic-time KSDs while being orders of magnitude faster to compute.

研究动机与目标

  • 为解决现有 Stein 偏差计算成本过高的问题,其计算复杂度随样本量呈二次方增长。
  • 克服如 FSSD 等线性时间替代方法在高维情形下统计功效下降的问题。
  • 开发一种可计算、能确定收敛性的偏差度量,兼具理论严谨性与实际高效性。
  • 通过近似线性时间方法,实现快速、可扩展的拟合优度检验和 MCMC 采样器选择。

提出的方法

  • 提出基于 Stein 算子和特征映射的新型积分概率度量类——特征 Stein 偏差(ΦSDs)。
  • 通过使用有限组特征构建 ΦSDs,以确保其能确定样本收敛到目标分布。
  • 通过引入重要性采样与提议分布,提出随机 ΦSDs(RΦSDs),以高效近似 ΦSDs。
  • 建立理论界,证明在高概率下,RΦSDs 可在 O(N^{1+γ}) 时间内实现 O(N^{-1/2}) 精度估计。
  • 在 i.i.d. 抽样下,推导 RΦSDs 的渐近零分布,以支持假设检验。
  • 优化特征选择,以在最小化计算成本的同时最大化检验功效。

实验结果

研究问题

  • RQ1能否构建一种 Stein 偏差,使其在保证可计算性的同时,严格确定样本收敛性?
  • RQ2线性时间近似版本的 Stein 偏差能否在高维情形下保持高统计功效?
  • RQ3使用随机特征的重要性采样能否产生具有理论保证的准确、可扩展的 Stein 偏差近似?
  • RQ4在拟合优度检验和采样器选择中,RΦSDs 与二次时间 KSDs 相比,在精度和速度方面表现如何?

主要发现

  • RΦSDs 在 O(N^{1+γ}) 时间内实现对真实 ΦSD 的 O(N^{-1/2}) 精度估计,支持近似线性计算。
  • 仅使用十个特征,RΦSDs 在采样器选择和拟合优度检验中即优于或匹配二次时间 KSDs 的性能。
  • RΦSDs 即使在高维情形下仍保持高检验功效,避免了如 FSSD 等先前线性时间方法的性能退化。
  • 理论分析表明,在适当的提议分布下,RΦSDs 以高概率在相对误差上接近真实 ΦSD。
  • 推导出 RΦSDs 的渐近零分布,使其在 i.i.d. 抽样原假设下可进行有效的假设检验。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。