Skip to main content
QUICK REVIEW

[论文解读] Testing hypotheses via a mixture estimation model

Kaniav Kamary, Kerrie K. Mengersen|arXiv (Cornell University)|Dec 5, 2014
Statistical Methods and Bayesian Inference参考文献 79被引用 53
一句话总结

本文提出了一种新颖的贝叶斯假设检验框架,将模型比较重新表述为混合分布估计问题,其中每个模型在混合分布中的权重成为关注的核心参数。通过在混合权重上使用参考Beta先验,该方法允许使用不当先验,确保随着样本量增加的一致性,并在不依赖贝叶斯因子或后验概率的情况下,为模型选择提供一致的后验分布。

ABSTRACT

We consider a novel paradigm for Bayesian testing of hypotheses and Bayesian model comparison. Our alternative to the traditional construction of posterior probabilities that a given hypothesis is true or that the data originates from a specific model is to consider the models under comparison as components of a mixture model. We therefore replace the original testing problem with an estimation one that focus on the probability weight of a given model within a mixture model. We analyze the sensitivity on the resulting posterior distribution on the weights of various prior modeling on the weights. We stress that a major appeal in using this novel perspective is that generic improper priors are acceptable, while not putting convergence in jeopardy. Among other features, this allows for a resolution of the Lindley-Jeffreys paradox. When using a reference Beta B(a,a) prior on the mixture weights, we note that the sensitivity of the posterior estimations of the weights to the choice of a vanishes with the sample size increasing and avocate the default choice a=0.5, derived from Rousseau and Mengersen (2011). Another feature of this easily implemented alternative to the classical Bayesian solution is that the speeds of convergence of the posterior mean of the weight and of the corresponding posterior probability are quite similar.

研究动机与目标

  • 为解决长期存在的非信息性贝叶斯假设检验挑战,特别是对先验选择的敏感性以及对不当先验的禁止。
  • 克服传统方法(如贝叶斯因子和后验概率)的局限性,这些方法对先验建模敏感且缺乏直观解释。
  • 通过将假设检验重新表述为混合成分权重的估计问题,为经典贝叶斯检验提供一致且计算高效的替代方案。
  • 证明混合权重参数的后验分布可自然地作为模型选择与决策的可解释基础。
  • 建立该方法的理论与经验一致性,特别是在大样本情况下,并为混合权重上的Beta(𝑎₀, 𝑎₀)先验中𝑎₀ = 0.5的默认选择提供依据。

提出的方法

  • 将贝叶斯假设检验重新表述为混合模型估计问题,其中数据被建模为竞争性模型的混合,其权重参数为𝛼。
  • 将混合权重𝛼视为主要关注参数,其后验分布作为推断的基础,而非贝叶斯因子或后验模型概率。
  • 在𝛼上使用参考Beta(𝑎₀, 𝑎₀)先验,该先验允许使用不当先验,并且在样本量增大时对𝑎₀的选择具有鲁棒性。
  • 通过MCMC方法(如Metropolis-Hastings)实现后验计算,从而实现对𝛼和模型权重的完整后验推断。
  • 利用𝛼的后验分位数或尾部面积来校准决策(例如,拒绝、接受、不确定),类似于贝叶斯p值。
  • 在模型间采用统一参数化,以实现共享参数上的参考先验,增强客观推断能力。

实验结果

研究问题

  • RQ1能否将贝叶斯假设检验重新定义为混合估计问题,以提升可解释性与一致性?
  • RQ2在混合权重𝛼上使用参考Beta先验是否允许使用不当先验,同时保持一致性?
  • RQ3随着样本量增加,𝛼的后验分布行为如何?在正确模型下,其是否集中在0或1附近?
  • RQ4𝛼的后验对Beta(𝑎₀, 𝑎₀)先验中𝑎₀的选择是否敏感?该敏感性是否随样本量增加而消失?
  • RQ5该方法能否为贝叶斯因子和后验模型概率提供一个连贯的替代方案用于模型比较?

主要发现

  • 当数据由第一个模型生成时,混合权重𝛼的后验分布集中在1附近;当数据由第二个模型生成时,集中在0附近,表明具有良好的一致性。
  • 在大样本情况下,𝛼后验对𝛽(𝑎₀, 𝑎₀)先验中𝑎₀选择的敏感性消失,确保了方法的鲁棒性。
  • 当数据从逻辑斯蒂克模型模拟时,𝛼的后验中位数非常接近1(例如0.998);当从Probit模型模拟时,非常接近0(例如0.003),即使在𝑎₀值较小时也成立。
  • 该方法通过在混合权重上使用适当的先验,使得模型参数上可使用不当先验,解决了客观贝叶斯检验中长期存在的限制。
  • 𝛼的后验均值收敛速度与后验概率相近,表明在计算与推断性能上具有等价性。
  • 推荐将𝛽(𝑎₀, 𝑎₀)先验中的𝑎₀默认设为0.5,该选择得到理论一致性与实证结果的支持。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。