[论文解读] Causal mediation analysis in presence of multiple mediators uncausally related
本文提出了一种因果中介框架,用于处理由于共同未观测原因导致的非因果相关多个中介变量。在顺序忽略性假设下,该框架建立了自然直接效应和联合间接效应的非参数可识别性,并引入了一种基于模拟的准贝叶斯估计程序。其主要贡献在于能够在中介变量相关但无因果关系的设定下估计个体和联合间接效应,从而将标准中介模型扩展至超越条件独立性假设的场景。
Mediation analysis aims at disentangling the effects of a treatment on an outcome through alternative causal mechanisms and has become a popular practice in biomedical and social science applications. The causal framework based on counterfactuals is currently the standard approach to mediation, with important methodological advances introduced in the literature in the last decade, especially for simple mediation, that is with one mediator at the time. Among a variety of alternative approaches, K. Imai et al. showed theoretical results and developed an R package to deal with simple mediation as well as with multiple mediation involving multiple mediators conditionally independent given the treatment and baseline covariates. This approach does not allow to consider the often encountered situation in which an unobserved common cause induces a spurious correlation between the mediators. In this context, which we refer to as mediation with uncausally related mediators, we show that, under appropriate hypothesis, the natural direct and joint indirect effects are non-parametrically identifiable. Moreover, we adopt the quasi-Bayesian algorithm developed by Imai et al. and propose a procedure based on the simulation of counterfactual distributions to estimate not only the direct and joint indirect effects but also the indirect effects through individual mediators. We study the properties of the proposed estimators through simulations. As an illustration, we apply our method on a real data set from a large cohort to assess the effect of hormone replacement treatment on breast cancer risk through three mediators, namely dense mammographic area, nondense area and body mass index.
研究动机与目标
- 解决现有中介方法中假设多个中介变量之间条件独立的局限性。
- 建模由于未观测共同原因导致中介变量相关的情形,从而违反标准忽略性假设。
- 在存在非因果相关中介变量的情况下,基于顺序忽略性假设,建立自然直接效应与联合间接效应的非参数可识别性。
- 开发一种基于模拟的估计程序,以计算此类复杂中介结构中的个体与联合间接效应。
- 通过模拟验证该方法,并将其应用于一项关于激素替代疗法与乳腺癌风险关系的大规模队列研究。
提出的方法
- 采用Imai等人(2010)的反事实框架,并将其扩展至具有非因果相关性的多个中介变量。
- 通过在处理和中介变量上施加干预下的潜在结果,定义自然直接效应与间接效应。
- 在顺序忽略性假设(SIMMA)下建立效应的可识别性,包括在处理和协变量条件下潜在结果的条件独立性。
- 使用准贝叶斯算法模拟不同干预制度下中介变量和结果的反事实分布。
- 通过模拟的条件期望估计每个中介变量的个体间接效应以及通过两个中介变量的联合间接效应。
- 将该方法应用于大规模队列研究的真实数据,以评估激素替代疗法通过三个中介变量(致密区域、非致密区域和BMI)对乳腺癌风险的影响。
实验结果
研究问题
- RQ1当多个中介变量由于未观测共同原因而呈现非因果相关时,自然直接效应与联合间接效应是否可以在非参数条件下被识别?
- RQ2在中介变量相关但无因果排序关系的情况下,如何估计个体与联合间接效应?
- RQ3在中介变量相关性水平不同的情况下,所提出的基于模拟的估计程序表现如何?
- RQ4条件独立性假设的违反如何影响中介效应估计的偏差与精度?
- RQ5中介变量相关性对二值结果模型中间接效应估计的影响是什么?
主要发现
- 在顺序忽略性假设(SIMMA)下,即使中介变量之间存在非因果相关性,自然直接效应与联合间接效应仍可实现非参数可识别。
- 基于模拟的准贝叶斯程序在有限样本中成功估计了个体与联合间接效应,且偏差与置信区间覆盖度可接受。
- 在模型1(连续结果)中,真实联合间接效应为44,个体间接效应分别为20与24,总效应为54,表明效应分解具有一致性。
- 在模型2(二值结果)中,真实联合间接效应随中介变量间相关性变化而变化,该方法成功捕捉到这种依赖关系,如图9所示。
- 直接与间接效应估计的偏差随中介变量相关性增加而上升,尤其在二值结果模型中更为明显,如图12所示。
- 该方法在不同相关性水平下保持了合理的置信区间覆盖概率与较低的均方误差(MSE),尤其在采用多重分析而非简单分析时表现更优(图11)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。