Skip to main content
QUICK REVIEW

[论文解读] Statistical Matching and Subclassification with a Continuous Dose: Characterization, Algorithms, and Inference

Bo Zhang, Emily J. MacKay|arXiv (Cornell University)|Jan 1, 2020
Advanced Causal Inference Techniques参考文献 42被引用 2
一句话总结

本文针对连续处理剂量的观察性研究提出了最优分层与完整匹配方法,引入了两项用于分层同质性的标准,并提出了一种多项式时间算法,该算法在一项标准下保证最优性,在另一项标准下提供2-近似解。当与回归校正结合使用时,该方法在因果推断中降低了模型依赖性,其有效性在模拟研究和一项关于冠状动脉旁路移植术中经食管超声心动图(TEE)使用的Medicare/Medicaid索赔数据研究中得到验证。

ABSTRACT

Subclassification and matching are often used to adjust for observed covariates in observational studies; however, they are largely restricted to relatively simple study designs with a binary treatment. One important exception is Lu et al.(2001), who considered optimal pair matching with a continuous treatment dose. In this article, we propose two criteria for optimal subclassification/full matching based on subclass homogeneity with a continuous treatment dose, and propose an efficient polynomial-time algorithm that is guaranteed to find an optimal subclassification with respect to one criterion and serves as a 2-approximation algorithm for the other criterion. We discuss how to incorporate treatment dose and use appropriate penalties to control the number of subclasses in the design. Via extensive simulations, we systematically examine the performance of our proposed method, and demonstrate that combining our proposed subclassification scheme with regression adjustment helps reduce model dependence for parametric causal inference with a continuous treatment dose. We illustrate the new design and how to conduct randomization-based statistical inference under the new design using Medicare and Medicaid claims data to study the effect of transesophageal echocardiography (TEE) during CABG surgery on patients' 30-day mortality rate.

研究动机与目标

  • 填补观察性研究中连续处理剂量下分层与匹配方法的空白。
  • 开发确保连续处理剂量下分层同质性的最优分层标准。
  • 设计一种高效算法,保证在一项标准下最优,并在另一项标准下提供2-近似解。
  • 在设计中引入处理剂量和惩罚项,以控制分层数量。
  • 通过模拟和真实世界应用,证明该方法在降低模型依赖性方面的有效性。

提出的方法

  • 基于连续处理剂量下的分层同质性,提出两项最优分层标准。
  • 开发一种多项式时间算法,在一项标准下保证最优分层,在另一项标准下提供2-近似解。
  • 通过适当的惩罚函数将处理剂量整合到分层过程中,以控制分层数量。
  • 将所提出的分层方法与回归校正结合,以降低参数化因果推断中的模型依赖性。
  • 采用基于随机化的统计推断方法,评估新设计下的因果效应。
  • 将该方法应用于Medicare和Medicaid索赔数据,研究经食管超声心动图(TEE)对冠状动脉旁路移植术术后30天死亡率的影响。

实验结果

研究问题

  • RQ1如何将分层与匹配方法扩展至处理连续处理剂量的观察性研究?
  • RQ2在处理为连续的情况下,何种标准可确保最优分层同质性?
  • RQ3能否开发一种高效的多项式时间算法,以在这些标准下找到最优或近似最优的分层方案?
  • RQ4将所提出的分层方法与回归校正结合使用,对因果推断中的模型依赖性有何影响?
  • RQ5该方法在真实世界数据中的表现如何,特别是在估计TEE对术后死亡率影响方面?

主要发现

  • 所提出的算法在一项分层同质性标准下保证最优性,在另一项标准下提供2-近似解。
  • 通过引入处理剂量和惩罚项,可有效控制设计中的分层数量。
  • 模拟结果表明,将分层方案与回归校正结合使用,能显著降低参数化因果推断中的模型依赖性。
  • 该方法在降低偏差和提高连续处理下因果效应估计的精度方面表现出色。
  • 在Medicare和Medicaid索赔数据上的应用表明,该设计可有效实现对冠状动脉旁路移植术后30天死亡率中TEE效应的合理基于随机化的推断。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。