QUICK REVIEW

[论文解读] Identifying Causal Effects With Proxy Variables of an Unmeasured Confounder

Wang Miao, Zhi Geng|arXiv (Cornell University)|Sep 28, 2016

Advanced Causal Inference Techniques参考文献 15被引用 22

一句话总结

本文提出了一种在未观测到混杂因素但存在两个或更多独立代理变量时，对因果效应进行非参数识别的方法。该方法在弱于以往研究的秩条件基础上实现识别，无需了解测量误差机制，并在识别失败时提出了对无因果效应原假设的有效检验。

ABSTRACT

We consider a causal effect that is confounded by an unobserved variable, but with observed proxy variables of the confounder. We show that, with at least two independent proxy variables satisfying a certain rank condition, the causal effect is nonparametrically identified, even if the measurement error mechanism, i.e., the conditional distribution of the proxies given the con- founder, may not be identified. Our result generalizes the identification strategy of Kuroki & Pearl (2014) that rests on identification of the measurement error mechanism. When only one proxy for the confounder is available, or the required rank condition is not met, we develop a strategy to test the null hypothesis of no causal effect.

研究动机与目标

解决当混杂因素未被观测但存在代理变量时因果推断中的未测量混杂问题。
在无需了解测量误差机制（即给定混杂因素时代理变量的分布）的前提下，识别处理对结果的因果效应。
推广先前依赖于测量误差机制识别结果的研究，例如 Kuroki & Pearl (2014) 的结果。
当仅有一个代理变量或秩条件不成立时，提供对无因果效应原假设的有效统计检验。
将框架扩展至连续混杂因素及多个混杂因素及其对应代理变量的情形。

提出的方法

提出一种基于代理变量与处理变量联合分布秩条件的新型识别策略，该条件弱于 Kuroki & Pearl (2014) 所需的测量误差识别条件。
利用条件期望算子的奇异值分解（SVD）刻画非参数识别中出现的积分方程解的存在性。
在通过秩条件建立因果效应识别后，应用 Greenland & Lash (2008) 的矩阵调整技术。
基于代理变量与结果的联合分布，推导出无因果效应原假设的检验统计量，该检验在识别条件不满足时依然有效。
通过条件化于可观测协变量并对其分布进行边际化，以恢复边际因果效应。
通过假设与图1中模型(f)一致的条件独立结构，将框架扩展至多个混杂因素及其代理变量。

实验结果

研究问题

RQ1当混杂因素未被观测但存在两个独立代理变量时，是否可以在不识别测量误差机制的前提下，非参数地识别因果效应？
RQ2仍能实现因果效应非参数识别的最弱正则性与秩条件集合是什么？
RQ3当仅有一个代理变量或识别条件不成立时，是否可以构建对无因果效应原假设的有效经验检验？
RQ4在有限样本中，该方法在第一类错误率与统计功效方面相较于标准调整或矩阵调整方法表现如何？
RQ5该识别策略能否扩展至连续混杂因素及多个混杂因素及其对应代理变量的情形？

主要发现

即使测量误差机制（即 Pr(Z|U)）未被识别，只要代理变量与处理变量联合分布满足秩条件，因果效应即可实现非参数识别。
该识别条件弱于 Kuroki & Pearl (2014) 所要求的条件，后者依赖于对测量误差机制的识别。
当仅有一个代理变量或秩条件不成立时，开发了一种对无因果效应原假设的有效经验检验，其第一类错误率在原假设下近似等于名义水平。
模拟结果表明，随着真实因果效应的增大，该检验策略的统计功效逐渐趋近于1，证实了其经验有效性。
该方法适用于离散和连续混杂因素，但由于需求解积分方程，非参数估计具有挑战性，留待未来工作解决。
在模型(f)的条件独立结构成立的前提下，该框架可推广至多个混杂因素及其代理变量。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。