Skip to main content
QUICK REVIEW

[论文解读] High-dimensional doubly robust tests for regression parameters

Oliver Dukes, Vahe Avagyan|arXiv (Cornell University)|May 17, 2018
Statistical Methods and Inference参考文献 27被引用 8
一句话总结

本文提出了一种高维双重稳健检验方法,用于回归参数的推断,该方法在较弱的稀疏性条件下仍保持一致有效性,并且在暴露或结果模型之一被错误设定时仍能维持有效性。该方法采用惩罚似然估计而无需样本分割,从而可借助现有软件实现,同时确保对模型误设的稳健性。

ABSTRACT

After variable selection, standard inferential procedures for regression parameters may not be uniformly valid; there is no finite sample size at which a standard test is guaranteed to attain its nominal size (within pre-specified error margins). This problem is exacerbated in high-dimensional settings, where variable selection becomes unavoidable. This has prompted a flurry of activity in developing uniformly valid hypothesis tests for a low-dimensional regression parameter (e.g. the causal effect of an exposure A on an outcome Y) in high-dimensional models. So far there has been limited focus on model misspecification, although this is inevitable in high-dimensional settings. We propose tests of the null that are uniformly valid under sparsity conditions weaker than those typically invoked in the literature, assuming working models for the exposure and outcome are both correctly specified. When one of the models is misspecified, by amending the procedure for estimating the nuisance parameters, our tests continue to be valid; hence they are then doubly robust. Our proposals are straightforward to implement using existing software for penalized maximum likelihood estimation and do not require sample-splitting. We illustrate them in simulations and an analysis of data obtained from the Ghent University Intensive Care Unit.

研究动机与目标

  • 解决在高维设定下变量选择后回归参数推断缺乏一致有效性的不足。
  • 开发在弱于以往要求的稀疏性假设下仍保持有效的检验方法。
  • 确保当暴露模型或结果模型之一被错误设定时,检验仍保持有效性,实现双重稳健性。
  • 提供一种可使用标准软件进行惩罚似然估计的实用方法。
  • 避免使用样本分割,以减少效率损失并简化实现过程。

提出的方法

  • 该方法基于同时包含暴露和结果工作模型的估计方程构造检验统计量。
  • 在高维设定下,使用惩罚似然估计来估计干扰参数。
  • 通过引入影响函数或校正偏差的估计方程,对检验统计量进行调整,以应对模型误设的影响。
  • 通过在弱于以往方法的稀疏性条件下控制大小,确保检验的统一有效性。
  • 该方法无需样本分割,从而保持估计效率并简化实现。
  • 该方法利用现有软件进行惩罚似然估计,从而实现广泛可及性与实际部署。

实验结果

研究问题

  • RQ1在弱于文献中通常假设的稀疏性条件下,能否在高维模型中开发出对低维回归参数的统一有效检验?
  • RQ2在无需样本分割的情况下,如何在高维设定中实现双重稳健性?
  • RQ3模型误设对推断有何影响,如何在高维回归中校正此类影响?
  • RQ4能否使用惩罚似然估计在不分割数据的情况下构建有效的检验?
  • RQ5与标准方法相比,所提出的检验在有限样本中的表现如何?

主要发现

  • 所提出的检验在弱于文献中通常假设的稀疏性条件下仍保持统一有效性。
  • 即使暴露或结果的工作模型之一被错误设定,检验仍保持有效性,实现了双重稳健性。
  • 该方法无需样本分割,从而保持统计效率并简化实现。
  • 该方法可使用标准软件进行惩罚似然估计实现。
  • 来自根特大学重症监护病房的模拟与真实数据分析表明,该方法具有稳健性与实际应用价值。
  • 在包括模型误设在内的多种高维情景下,检验均实现了名义上的大小控制。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。