Skip to main content
QUICK REVIEW

[論文レビュー] A compendium of covariances and correlation coefficients of coalescent tree properties

Egor Alimpiev, Noah A. Rosenberg|arXiv (Cornell University)|Mar 24, 2021
Genetic Mapping and Diversity in Plants and Animals参考文献 32被引用数 8
ひとこと要約

本稿では、キングマン共alescent下で15組の共熟木の性質—高さ(Hn)、全長(Ln)、外部枝長(En)、内部枝長(In)、基底枝平均(Bn)、および共熟時刻(Tk)—の正確および近似の共分散および相関係数を導出する。n → ∞ の極限において、Hn、Ln、In、Bnは非常に相関が強く、すべての対間相関係数が 0.8493 を超えることが示された。一方、En は Hn と同様に期待値が等しいが、極限において他の変数と相関がなく、無相関である。

ABSTRACT

Gene genealogies are frequently studied by measuring properties such as their height ($H$), length ($L$), sum of external branches ($E$), sum of internal branches ($I$), and mean of their two basal branches ($B$), and the coalescence times that contribute to the other genealogical features ($T$). These tree properties and their relationships can provide insight into the effects of population-genetic processes on genealogies and genetic sequences. Here, under the coalescent model, we study the 15 correlations among pairs of features of genealogical trees: $H_n$, $L_n$, $E_n$, $I_n$, $B_n$, and $T_k$ for a sample of size $n$, with $2 \leq k \leq n$. We report high correlations among $H_n$, $L_n$, $I_n,$ and $B_n$, with all pairwise correlations of these quantities having values greater than or equal to $\sqrt{6} [6 \zeta(3) + 6 - \pi^2] / ( \pi \sqrt{18 + 9\pi^2 - \pi^4}) \approx 0.84930$ in the limit as $n ightarrow \infty$. Although $E_n$ has an expectation of 2 for all $n$ and $H_n$ has expectation 2 in the limit as $n ightarrow \infty$, their limiting correlation is 0. The results contribute toward understanding features of the shapes of coalescent trees.

研究の動機と目的

  • 共熟木の主要特徴 Hn, Ln, En, In, Bn, Tk 間の統計的関係を体系的に定量化すること。
  • 標準キングマン共熟木モデル下で、これらの特徴の15組すべての正確および極限共分散および相関係数を計算すること。
  • 特に大標本における、木の形状的特徴(例:基底枝長 Bn)が他の性質とどのように相関するかという長年の理解の空白を解消すること。
  • 特にサイト周波数スペクトルに基づく検定に用いるための、相互依存関係の基盤的コンプリメンタリーを提供すること。

提案手法

  • すべての木の特徴が共熟時刻 Tk の線形関数であることに基づき、共熟過程を用いて正確な共分散および相関係数の式を導出する。
  • 既知の分布を活用:Tk ~ Exp(k/2),E[Tk] = 2/(k(k−1)) および Var[Tk] = 4/(k²(k−1)²) を用い、Hn, Ln, En, In, Bn をこれらの Tk の和または関数として表現する。
  • 再帰的関係および既知の結果(例:Fu & Li, 1993;Arbisser et al., 2018)を用いて、特に En および Bn の分散および共分散を導出する。
  • 漸近的解析(n → ∞)を用いて極限相関係数を評価し、ζ(2) = π²/6 および ζ(3) ≈ 1.20206 などのリーマンゼータ関数の極限値を用いる。
  • (En, Bn)および(In, Bn)の組に対して、シミュレーションによる検証と解析的近似に基づき、近似共分散および相関係数を導出する。
  • リーマンゼータ関数および調和和(Sp,n = ∑₁ⁿ 1/kᵖ)を用いて極限値を表現し、Hn, Ln, In, Bn 間の極限相関係数の下限として √[6(6ζ(3)+6−π²)]/(π√(18+9π²−π⁴)) ≈ 0.84930 を得る。

実験結果

リサーチクエスチョン

  • RQ1Hn, Ln, En, In, Bn, Tk の15組すべての共熟木特徴間の正確および極限相関係数は何か?
  • RQ2En と Hn は期待値がともに 2 であるが、なぜ極限においては Hn, Ln, In, Bn と相関がなく、無相関となるのか?
  • RQ3Bn と他の特徴の相関は、Hn や Ln と比較してどう異なるか。特に Bn が Tk の確率的長さの和であることに鑑み、その影響を検討する。
  • RQ4In と Ln 間の相関の漸近的挙動は何か。なぜ極限においては完全に相関しているのか?
  • RQ5特にサイト周波数スペクトルに基づく推論において、木の特徴の連関性を定量化することで、それらの同時分布はより良く理解できるか?

主な発見

  • Hn, Ln, In, Bn 間のすべての対間相関係数は、n → ∞ の極限で少なくとも 0.84930 に収束し、正確な下限は √[6(6ζ(3)+6−π²)]/(π√(18+9π²−π⁴)) ≈ 0.84930 で与えられる。
  • In と Ln 間の極限相関係数は正確に 1 であり、内部長と全長が漸近的に完全に相関していることを示している。
  • En と Hn はともに極限期待値が 2 であるが、その極限相関係数は 0 であり、これらが漸近的に無相関であることを示している。
  • Bn と Tk(k > 2)の相関係数は、Hn と Tk の相関係数よりも一般的に小さい。これは、Bn が T2 に強く影響を受けるためである。
  • En と Tk 間の相関係数は一定であり、k に依存せず、外部枝が後の共熟時刻に直接影響されないことに起因する。
  • (En, Bn)および(In, Bn)の組に対して、シミュレーションによる検証を経た近似共分散および相関係数が提供されており、既存の枝長分布に関する先行研究を拡張することで正確な導出が可能になる可能性がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。