Skip to main content
QUICK REVIEW

[論文レビュー] Bayesian Computation and Model Selection in Population Genetics

Christoph Leuenberger Daniel Wegmann Laurent Excoffier|ArXiv.org|Jan 15, 2009
Genetic Mapping and Diversity in Plants and Animals参考文献 23被引用数 20
ひとこと要約

本稿では、一般化線形モデル(GLM)を用いて近似ベイズ計算(ABC)を再定式化することで、尤度関数が解析的に扱いにくい状況下でも、ベイズ係数を用いた信頼性の高いモデル選択を可能にするABC-GLMという、新たなベイズ計算手法を提案する。GLMを用いて要約統計量とパラメータの関係をモデル化することで、事前分布と整合的であり、尤度関数が不変な場合でも頑健な推論が可能となり、西アフリカチンパンジーにおける集団の亜構造の検出に成功。ベイズ係数は10^5を超える。

ABSTRACT

Until recently, the use of Bayesian inference in population genetics was limited to a few cases because for many realistic population genetic models the likelihood function cannot be calculated analytically . The situation changed with the advent of likelihood-free inference algorithms, often subsumed under the term Approximate Bayesian Computation (ABC). A key innovation was the use of a post-sampling regression adjustment, allowing larger tolerance values and as such shifting computation time to realistic orders of magnitude (see Beaumont et al., 2002). Here we propose a reformulation of the regression adjustment in terms of a General Linear Model (GLM). This allows the integration into the framework of Bayesian statistics and the use of its methods, including model selection via Bayes factors. We then apply the proposed methodology to the question of population subdivision among western chimpanzees Pan troglodytes verus.

研究の動機と目的

  • 尤度関数が解析的に不変な集団遺伝学におけるベイズ推論の課題に対処すること。
  • 尤度関数が不変な状況下でも、ベイズ係数を用いた信頼性の高いモデル選択を可能にする手法を開発すること。
  • 回帰補正ABCを一般化線形モデル(GLM)を用いて再定式化し、理論的整合性と計算上の頑健性を向上させること。
  • 西アフリカチンパンジー(Pan troglodytes verus)における集団構造モデルの対立仮説を検証すること。
  • ABC-GLMが、さまざまな許容水準において安定的かつ正確な後方分布近似とモデル選択を提供することを示すこと。

提案手法

  • シミュレーションされた要約統計量とモデルパラメータの関係をモデリングするため、一般化線形モデル(GLM)を用いてABCにおける回帰補正を再定式化する。
  • GLMを用いて、切断されたモデルの尤度関数を推定し、事前分布と整合的であることを保証する。
  • 得られた後方分布近似を用いて、モデル比較のためのベイズ係数を計算する。
  • SIMCOAL2を用いて、異なる集団モデル(島モデル対パニックティックモデル)の下で確率的シミュレーションを実施する。
  • Arlequin3.0を用いて要約統計量を計算:各遺伝子座あたりの平均アレルグ数(K)およびFIS固定係数。
  • 受容率(Aε)を変化させた状況でモデルの性能を評価し、ベイズ係数の安定性を検証する。

実験結果

リサーチクエスチョン

  • RQ1ABCにおけるGLMベースの回帰補正は、尤度関数が不変なモデルにおいて、後方分布の整合的で理論的根拠のある近似を提供できるか?
  • RQ2ABC-GLMアプローチは、集団遺伝学的推論において、ベイズ係数を用いた信頼性の高いモデル選択を可能にするか?
  • RQ3ABCにおける異なる許容水準において、集団構造モデルのベイズ係数は安定しているか?
  • RQ4標準的なモデルがパニックティックを仮定する状況下でも、ABC-GLMは西アフリカチンパンジーにおける集団の亜構造を検出できるか?
  • RQ5KやFISといった要約統計量が、単に近交の影響を反映しているのではなく、背後にある集団構造をどれほど正確に反映しているか?

主な発見

  • ABC-GLM手法は、許容水準が0.005以上の場合、広い範囲の許容値において安定したベイズ係数を生成し、最小限の変動を示した。
  • ベイズ係数は島モデルをパニックティックモデルよりも強く支持しており、B ≈ e^12 > 10^5 であり、集団亜構造の決定的証拠を示している。
  • 西アフリカチンパンジーで観察されたFIS値2.6%は、パニックティックモデルではあり得ないが、島モデルでは容易に説明可能である。
  • 許容水準が十分に大きく、パラメータ推定が安定するように設定されていれば、限られたシミュレーションでも信頼性の高いモデル選択が可能である。
  • ABC-GLMフレームワークは、任意のABCサンプラーと互換性があり、非線形的かつ異分散性のある関係を扱える拡張GLM形式を用いることで高度なモデリングが可能である。
  • このアプローチは、標準的なベイズ推論に自然に統合可能であり、ベイズ係数の使用やモデル平均化が可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。