[论文解读] An Extended Sensitivity Analysis for Heterogeneous Unmeasured Confounding
本文提出了一种扩展的敏感性分析方法,联合约束成对观察性研究中最大和典型的隐藏偏差,当极端偏差较为罕见时,提升了稳健性评估的准确性。通过求解二次规划问题,该方法保持了第一类错误率的控制,并提供了对混杂因素更现实的评估,其在包含和不包含认知能力数据的同卵双生子教育与收入研究中得到了验证。
The conventional model for assessing insensitivity to hidden bias in paired observational studies constructs a worst-case distribution for treatment assignments subject to bounds on the maximal bias to which any given pair is subjected. In studies where rare cases of extreme hidden bias are suspected, the maximal bias may be substantially larger than the typical bias across pairs, such that a correctly specified bound on the maximal bias would yield an unduly pessimistic perception of the study's robustness to hidden bias. We present an extended sensitivity analysis which allows researchers to simultaneously bound the maximal and typical bias perturbing the pairs under investigation while maintaining the desired Type I error rate. We motivate and illustrate our method with two sibling studies on the impact of schooling on earnings, one containing information of cognitive ability of siblings and the other not. Cognitive ability, clearly influential of both earnings and degree of schooling, is likely similar between members of most sibling pairs yet could, conceivably, vary drastically for some siblings. The method is straightforward to implement, simply requiring the solution to a quadratic program. $ exttt{R}$ code is provided in the supplementary materials.
研究动机与目标
- 为解决传统敏感性分析的局限性,即假设所有配对中最大偏差一致,且在极端偏差罕见时可能高估稳健性。
- 开发一种方法,同时约束成对观察性研究中隐藏偏差的最大值和平均值。
- 在允许对未测量混杂因素施加更现实的边界的同时,保持名义上的第一类错误率。
- 改进在未测量混杂因素(如认知能力)可能仅在少数同卵双生子对中显著变化的研究中因果效应的评估。
提出的方法
- 该方法在成对观察性研究中对所有配对的最大偏差(最坏情况)和典型偏差(平均值)施加联合约束。
- 将问题形式化为二次规划,以在联合偏差约束下寻找最有利的结果,同时保持第一类错误率的控制。
- 采用在双重边界下的最坏情况处理分配分布,确保对未测量混杂因素的稳健性。
- 通过优化框架实现该方法,平衡对极端偏差和常见偏差的敏感性。
- 使研究者能够评估因果结论在典型和最大未测量混杂因素范围内的稳健性。
- 补充材料中提供了R代码,便于在实际研究中直接实现。
实验结果
研究问题
- RQ1当怀疑未测量混杂因素虽罕见但某些配对中极端时,如何改进敏感性分析?
- RQ2联合约束典型偏差和最大偏差在多大程度上能提供比传统方法更现实的稳健性评估?
- RQ3敏感性分析能否在同时纳入平均偏差和最坏情况偏差约束的同时,保持第一类错误率的控制?
- RQ4在同卵双生子教育与收入研究中,将认知能力作为测量混杂因素纳入后,对敏感性分析的解释有何影响?
- RQ5在存在潜在未测量混杂因素的真实观察性研究中,使用扩展的偏差边界会产生何种实际影响?
主要发现
- 该扩展敏感性分析通过区分未测量混杂因素的典型水平和最大水平,提供了更细致的稳健性评估。
- 在包含认知能力数据的同卵双生子研究中,该方法揭示了比传统方法更强的对隐藏偏差的稳健性,反映出测量混杂因素的稳定作用。
- 在不包含认知能力数据的研究中,该扩展方法仍提供了更现实的偏差边界,避免了因高估最大偏差而产生的悲观结论。
- 该方法在同时约束典型偏差和最大偏差的情况下,仍成功保持了名义上的第一类错误率。
- 二次规划的公式化形式实现了高效的计算,使该方法在实际研究中可常规使用。
- 补充材料中提供的R代码使研究人员能够立即实现该方法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。