Skip to main content
QUICK REVIEW

[论文解读] Bayesian hierarchical weighting adjustment and survey inference

Yajuan Si, Rob Trangucci|arXiv (Cornell University)|Jul 25, 2017
Statistical Methods and Bayesian Inference参考文献 43被引用 28
一句话总结

本文提出了一种统一的贝叶斯分层框架,将加权与多层回归和后分层(MRP)相结合,以改进有限总体推断,尤其针对小群体。通过以所有影响纳入的变量为条件对调查结果建模,并使用结构化先验来稳定高阶交互项,该方法生成平滑的、基于模型的权重,从而在方差上优于经典加权方法,提升稳健性。

ABSTRACT

We combine Bayesian prediction and weighted inference as a unified approach to survey inference. The general principles of Bayesian analysis imply that models for survey outcomes should be conditional on all variables that affect the probability of inclusion. We incorporate the weighting variables under the framework of multilevel regression and poststratification, as a byproduct generating model-based weights after smoothing. We investigate deep interactions and introduce structured prior distributions for smoothing and stability of estimates. The computation is done via Stan and implemented in the open source R package "rstanarm" ready for public use. Simulation studies illustrate that model-based prediction and weighting inference outperform classical weighting. We apply the proposal to the New York Longitudinal Study of Wellbeing. The new approach generates robust weights and increases efficiency for finite population inference, especially for subsets of the population.

研究动机与目标

  • 解决经典调查加权方法的局限性,后者依赖于任意选择,且由于极端权重导致方差过高。
  • 通过在一致的基于模型的框架中整合复杂设计特征和辅助变量,改进小区域估计。
  • 开发一种结构化先验分布,以稳定多层次模型中的高阶交互项,提升估计的可靠性。
  • 提供一种可扩展、计算高效的调查推断方法,利用Stan和rstanarm R包实现公开使用。
  • 通过将加权调整建立在预测建模基础上,实现在非概率调查和数据整合中的稳健推断。

提出的方法

  • 构建一个贝叶斯分层模型,其中调查结果以所有影响纳入的变量为条件进行预测,确保与基于设计的原理相兼容。
  • 将经典加权调整整合进多层回归和后分层(MRP)框架中,通过平滑化生成基于模型的权重。
  • 应用结构化先验以收缩高维交互项(例如,年龄×种族×教育程度),提升小单元中估计的稳定性并减少过拟合。
  • 通过Stan使用马尔可夫链蒙特卡洛(MCMC)进行后部分布推断,实现完整的不确定性量化和稳健的方差估计。
  • 通过后分层将基于模型的权重校准至已知总体总数,确保校准的同时保留基于模型的平滑性。
  • 在开源rstanarm R包中实现该方法,使从业者能够便捷、可复现地进行调查推断。

实验结果

研究问题

  • RQ1统一的贝叶斯框架是否能通过在一个统一的、一致的模型中结合加权与预测,改进有限总体推断?
  • RQ2针对高阶交互项的结构化先验在多大程度上提升了调查数据中小区域估计的稳定性和准确性?
  • RQ3在方差减少和稳健性方面,基于模型的权重在多大程度上优于经典的设计基础权重?
  • RQ4在具有稀疏子群体的复杂、不平衡调查设计下,该方法表现如何?
  • RQ5该方法能否在非概率调查和数据整合任务中有效应用?

主要发现

  • 所提出的贝叶斯分层加权方法相比经典加权方法,显著降低了有限总体估计的方差,尤其在小群体中表现更优。
  • 通过平滑化和结构化先验生成的基于模型的权重比传统逆概率权重更稳定,对极端值的敏感性更低。
  • 模拟研究显示,该方法在均方误差和覆盖率概率方面优于经典加权方法,尤其在不平衡设计下表现更佳。
  • 对交互项引入结构化先验可提升稀疏单元中估计的可靠性,减少过拟合并改善泛化能力。
  • rstanarm的实现支持高效计算和实际应用,该方法在纽约幸福感纵向研究中的应用表现出色。
  • 欧几里得距离度量显示,基于模型的权重(Str-W)比重加权(Rake-W)或后分层权重(PS-W)更接近总体分布,表明其具有更好的校准性和平衡性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。