[论文解读] Bayesian Computation and Model Selection in Population Genetics
本文提出ABC-GLM,一种新颖的贝叶斯计算方法,通过使用广义线性模型(GLM)重新表述近似贝叶斯计算(ABC),实现基于贝叶斯因子的可靠模型选择。通过使用GLM对摘要统计量与参数之间的关系进行建模,该方法确保与先验分布的一致性,并在似然函数不可计算时仍能实现稳健推断,成功检测到西部黑猩猩中的种群亚结构,贝叶斯因子 >10^5。
Until recently, the use of Bayesian inference in population genetics was limited to a few cases because for many realistic population genetic models the likelihood function cannot be calculated analytically . The situation changed with the advent of likelihood-free inference algorithms, often subsumed under the term Approximate Bayesian Computation (ABC). A key innovation was the use of a post-sampling regression adjustment, allowing larger tolerance values and as such shifting computation time to realistic orders of magnitude (see Beaumont et al., 2002). Here we propose a reformulation of the regression adjustment in terms of a General Linear Model (GLM). This allows the integration into the framework of Bayesian statistics and the use of its methods, including model selection via Bayes factors. We then apply the proposed methodology to the question of population subdivision among western chimpanzees Pan troglodytes verus.
研究动机与目标
- 解决群体遗传学中似然函数解析不可计算所带来的贝叶斯推断挑战。
- 开发一种方法,使在似然函数不可计算的设定下,能够基于贝叶斯因子实现可靠的模型选择。
- 通过广义线性模型(GLM)重新表述回归调整的ABC,以提升理论一致性与计算稳健性。
- 将该方法应用于测试西部黑猩猩(Pan troglodytes verus)中竞争的种群结构模型。
- 证明ABC-GLM在不同容忍度水平下均能提供稳定且准确的后验近似与模型选择。
提出的方法
- 使用广义线性模型(GLM)重新表述ABC中的回归调整,以建模模拟摘要统计量与模型参数之间的关系。
- 利用GLM估计截断模型的似然函数,确保与先验分布的一致性。
- 将所得后验近似用于计算模型比较的贝叶斯因子。
- 使用SIMCOAL2进行随机模拟,以在不同种群模型(岛屿模型与随机交配模型)下生成数据。
- 使用Arlequin3.0计算摘要统计量:每座位的平均等位基因数(K)与FIS固定指数。
- 通过不同接受率(Aε)评估模型性能,以检验贝叶斯因子的稳定性。
实验结果
研究问题
- RQ1基于GLM的ABC回归调整能否在似然函数不可计算的模型中,提供一致且理论可靠的后验分布近似?
- RQ2ABC-GLM方法是否能在群体遗传推断中通过贝叶斯因子实现可靠的模型选择?
- RQ3在ABC中,种群结构模型的贝叶斯因子是否在不同容忍度水平下保持稳定?
- RQ4当标准模型假设为随机交配时,ABC-GLM能否检测到西部黑猩猩中的种群亚结构?
- RQ5K与FIS等摘要统计量在多大程度上反映潜在的种群结构,而非仅由近交引起?
主要发现
- ABC-GLM方法在广泛容忍度值范围内产生稳定的贝叶斯因子,当接受率 ≥0.005 时波动极小。
- 贝叶斯因子强烈支持岛屿模型而非随机交配模型,B ≈ e^12 > 10^5,表明存在决定性证据支持种群亚结构。
- 西部黑猩猩中观察到的2.6% FIS值在随机交配模型下极不可能,但在岛屿模型下可轻松解释。
- 只要容忍度水平足够大以确保稳定参数估计,该方法即使在模拟数量有限时也能实现可靠的模型选择。
- ABC-GLM框架与任何ABC采样器兼容,并可通过扩展的GLM形式支持高级建模,包括非线性与异方差关系。
- 该方法成功整合进标准贝叶斯推断流程,支持贝叶斯因子与模型平均的使用。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。