[论文解读] HT-eQTL: Integrative eQTL Analysis in a Large Number of Human Tissues
该论文提出了一种可扩展的分层贝叶斯方法 HT-eQTL,用于在数百个人类组织中进行整合性eQTL分析。通过联合建模组织特异性和共享的遗传效应,该方法实现了高效、错误发现率受控的多组织eQTL检测,相较于现有方法,计算时间显著减少,且发现能力得到提升。
Expression quantitative trait loci (eQTL) analysis identifies genetic markers associated with the expression of a gene. Most existing eQTL analyses and methods investigate association in a single, readily available tissue, such as blood. Joint analysis of eQTL in multiple tissues has the potential to improve, and expand the scope of, single-tissue analyses. Large-scale collaborative efforts such as the Genotype-Tissue Expression (GTEx) program are currently generating high quality data in a large number of tissues. However, computational constraints limit genome-wide multi-tissue eQTL analysis. We develop an integrative method under a hierarchical Bayesian framework for eQTL analysis in a large number of tissues. The model fitting procedure is highly scalable, and the computing time is a polynomial function of the number of tissues. Multi-tissue eQTLs are identified through a local false discovery rate approach, which rigorously controls the false discovery rate. Using simulation and GTEx real data studies, we show that the proposed method has superior performance to existing methods in terms of computing time and the power of eQTL discovery. We provide a scalable method for eQTL analysis in a large number of tissues. The method enables the identification of eQTL with different configurations and facilitates the characterization of tissue specificity.
研究动机与目标
- 为解决尽管GTEx等多组织数据集不断增长,全基因组多组织eQTL分析仍面临计算瓶颈的问题。
- 开发一种可扩展的方法,在分析大量组织中的eQTL时保持统计严谨性。
- 在人类组织中识别具有多样化调控模式的eQTL,包括组织特异性效应和共享效应。
- 采用局部错误发现率(fdr)方法,控制多组织eQTL发现中的错误发现率。
提出的方法
- 该方法采用分层贝叶斯模型,联合估计多个组织中的遗传效应,通过跨组织借用信息以提高估计效率。
- 通过具有结构化协方差的随机效应,联合建模组织特异性和共享的遗传效应,以捕捉调控异质性。
- 模型拟合过程的计算复杂度随组织数量呈多项式增长,从而实现对大规模数据集的高效计算。
- 采用局部错误发现率(fdr)程序控制多组织eQTL发现中的错误率,确保统计可靠性。
- 该方法采用变分推断方法近似后验分布,从而实现对高维数据的可扩展性。
实验结果
研究问题
- RQ1可扩展的统计框架是否能在保持统计严谨性的前提下,检测数百个人类组织中的eQTL?
- RQ2与单组织或非整合方法相比,分层贝叶斯模型在多组织eQTL发现中如何提升发现能力?
- RQ3该方法在多样化的人类组织中,能在多大程度上识别组织特异性与共享的eQTL?
- RQ4局部fdr方法如何在多组织eQTL分析中控制错误发现率?
主要发现
- HT-eQTL方法相较于现有方法,计算时间显著缩短,且计算时间随组织数量呈多项式增长。
- 在模拟研究和GTEx真实数据研究中,该方法在eQTL发现中表现出比单组织分析和联合分析方法更高的统计效能。
- 该方法成功识别出具有多样化调控配置的eQTL,包括仅在部分组织中活跃的eQTL以及具有共享效应的eQTL。
- 局部fdr方法在多组织中有效控制了错误发现率,确保了eQTL检测的可靠性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。