Skip to main content
QUICK REVIEW

[论文解读] A confounding bridge approach for double negative control inference on causal effects

Wang Miao, Xu Shi|arXiv (Cornell University)|Aug 15, 2018
Advanced Causal Inference Techniques参考文献 48被引用 27
一句话总结

本文提出了一种混淆桥方法,通过同时利用负向控制结果和负向控制暴露来调整因果推断中的未观测混淆。通过使用混淆桥函数建模潜在结果与负向控制结果之间的关系,该方法即使在标准工具变量假设不成立时也能识别平均因果效应,展现出在空气污染研究中的稳健性,其中初始效应在调整后被减弱。

ABSTRACT

Unmeasured confounding is a key challenge for causal inference. In this paper, we establish a framework for unmeasured confounding adjustment with negative control variables. A negative control outcome is associated with the confounder but not causally affected by the exposure in view, and a negative control exposure is correlated with the primary exposure or the confounder but does not causally affect the outcome of interest. We introduce an outcome confounding bridge function that depicts the relationship between the confounding effects on the primary outcome and the negative control outcome, and we incorporate a negative control exposure to identify the bridge function and the average causal effect. We also consider the extension to the positive control setting by allowing for nonzero causal effect of the primary exposure on the control outcome. We illustrate our approach with simulations and apply it to a study about the short-term effect of air pollution on mortality. Although a standard analysis shows a significant acute effect of PM2.5 on mortality, our analysis indicates that this effect may be confounded, and after double negative control adjustment, the effect is attenuated toward zero.

研究动机与目标

  • 解决观察性研究中的未观测混淆,这是因果推断中持续存在的挑战。
  • 开发一种同时利用负向控制结果和暴露的改进混淆调整方法。
  • 在弱于传统工具变量方法的假设下,实现平均因果效应的识别。
  • 增强时间序列和多源数据情境下因果推断的稳健性。
  • 为设计包含内置混淆诊断功能的观察性研究提供实用框架。

提出的方法

  • 引入一种混淆桥函数,将潜在结果的均值与负向控制结果的分布联系起来。
  • 利用负向控制暴露非参数地识别混淆桥函数和平均因果效应。
  • 采用广义矩估计(GMM)方法,在参数或半参数建模下实现高效且稳健的推断。
  • 在具有双重稳健性特性的线性结构模型下建立识别,确保若结果模型或控制模型中任一正确指定,估计结果即保持一致。
  • 扩展框架以允许主要暴露与负向控制结果之间存在直接因果效应。
  • 通过仅依赖 (Y, Z, X) 和 (W, Z, X) 的联合分布,而非 (Y, W) 的联合分布,实现两样本和汇总数据推断。

实验结果

研究问题

  • RQ1能否构建一种混淆桥函数,将潜在结果与负向控制结果关联起来,以实现未观测混淆的调整?
  • RQ2当标准工具变量假设不成立时,如何联合利用负向控制结果和暴露来识别平均因果效应?
  • RQ3所提出的混淆桥方法的识别假设和稳健性特性是什么?
  • RQ4该方法在多大程度上能校正存在未观测混杂因素的观察性研究中的偏倚,例如在空气污染研究中?
  • RQ5该方法能否被调整以允许主要暴露与负向控制结果之间存在直接因果联系?

主要发现

  • 在费城空气污染研究中,标准OLS估计显示PM2.5对死亡率有显著的急性影响(β₁ = 每10 μg/m³ PM2.5增加10,000人中死亡率上升84人)。
  • 经过双重负向控制调整后,估计效应减弱至β₁ = 45(95%置信区间:-6, 97),p值为0.0854,表明效应不再具有统计显著性。
  • 混淆检验在费城(α₁ = -40,p = 0.0167)和纽约(α₁ = -39,p = 0.0174)检测到显著的未观测混淆,但在波士顿未检测到。
  • 该方法通过识别并利用负向控制暴露和结果来调整混淆,成功修复了无效的工具变量。
  • 在线性模型中,该方法表现出双重稳健性,只要结果模型或控制模型中任一正确指定,估计结果即保持一致。
  • 该框架支持两样本和汇总数据推断,使无需个体层面数据即可整合多份研究结果成为可能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。