Skip to main content
QUICK REVIEW

[论文解读] Statistical inference in two-sample summary-data Mendelian randomization using robust adjusted profile score

Qingyuan Zhao, Jingshu Wang|arXiv (Cornell University)|Jan 29, 2018
Genetic Associations and Epidemiology参考文献 49被引用 258
一句话总结

本论文通过调整轮廓分数以处理多效性,开发鲁棒、一致性的两样本MR推断方法,基于摘要数据;包括用于系统性和个体性多效性的鲁棒版本(RAPS)。

ABSTRACT

Mendelian randomization (MR) is a method of exploiting genetic variation to unbiasedly estimate a causal effect in presence of unmeasured confounding. MR is being widely used in epidemiology and other related areas of population science. In this paper, we study statistical inference in the increasingly popular two-sample summary-data MR design. We show a linear model for the observed associations approximately holds in a wide variety of settings when all the genetic variants satisfy the exclusion restriction assumption, or in genetic terms, when there is no pleiotropy. In this scenario, we derive a maximum profile likelihood estimator with provable consistency and asymptotic normality. However, through analyzing real datasets, we find strong evidence of both systematic and idiosyncratic pleiotropy in MR, echoing the omnigenic model of complex traits that is recently proposed in genetics. We model the systematic pleiotropy by a random effects model, where no genetic variant satisfies the exclusion restriction condition exactly. In this case we propose a consistent and asymptotically normal estimator by adjusting the profile score. We then tackle the idiosyncratic pleiotropy by robustifying the adjusted profile score. We demonstrate the robustness and efficiency of the proposed methods using several simulated and real datasets.

研究动机与目标

  • 在潜在的多效性和测量误差下,动机并形式化两样本MR与GWAS摘要数据。
  • 开发在无多效性和存在多效性时均一致且渐近正态的因果效应估计量。
  • 提出对轮廓分数的鲁棒调整以处理系统性和个体性多效性。
  • 通过仿真和真实数据应用评估估计量性能。
  • 就摘要数据MR中的工具强度、弱工具和选择偏差提供指导。

提出的方法

  • 通过对无关参数gamma进行剥离,推导因果效应参数beta的轮廓似然。
  • 在模型1(无多效性)及对IV强度的假设下,证明类似LIML的估计量的一致性和渐近正态性。
  • 引入处理系统性多效性的调整轮廓分数(模型2)以及用于异常值的鲁棒版本(RAPS,模型3)。
  • 用来自摘要数据的插件估计替代未知方差分量,以获得标准误。
  • 讨论弱工具偏差并与IVW比较,强调对平均IV强度kappa的依赖。
  • 就LD聚簇、工具选择以及摘要数据MR中的独立性假设提供实用指导。

实验结果

研究问题

  • RQ1一个轮廓似然/分数方法是否能在使用摘要数据的情况下产生一致且渐近正态的MR因果效应估计?
  • RQ2多效性和测量误差如何影响基于摘要数据的两样本MR的推理,调整/轮廓鲁棒方法是否能缓解这些影响?
  • RQ3在摘要数据MR中,哪些估计量对系统性和个体性多效性具鲁棒性?
  • RQ4工具强度(kappa)在这些模型下如何影响一致性、效率和潜在偏差?
  • RQ5关于SNP选择和LD考虑的实际建议,以避免选择偏差和弱工具偏差?

主要发现

  • 在无多效性(模型1)下,来自轮廓似然的LIML-like估计量是一致且渐近正态的。
  • 在系统性多效性(模型2)下,可以通过调整后的轮廓分数获得一致且渐近正态的估计量。
  • 在组合的系统性和个体性多效性(模型3)下,鲁棒调整轮廓分数(RAPS)在对异常值具有鲁棒性同时保持效率。
  • 分析显示当工具为弱工具时,IVW估计量可能偏误,而所提出的方法通过考虑gamma和Gamma的测量误差来改进推断。
  • 可以通过来自摘要数据的V1和V2的插件估计来一致地估计标准误,从而获得有效推断。
  • 实证示例表明所提出的RAPS方法相较于标准方法具有鲁棒性和效率优势。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。