Skip to main content
QUICK REVIEW

[論文レビュー] On Poisson approximations for the Ewens sampling formula when the mutation parameter grows with the sample size

Koji Tsukuda|arXiv (Cornell University)|Apr 22, 2017
Bayesian Methods and Mixture Models参考文献 41被引用数 8
ひとこと要約

本稿は、標本サイズ $n$ と突然変異パラメータ $\theta$ が両方とも増加する状況において、Ewens の標本公式に対するポアソン近似法を開発する。主な対象は、アレルの総数 $K_n$ および成分数 $C_n^b$ である。ポアソン過程による近似を用いて、弱収束をブラウン運動に導く。古典的結果を $\theta \to \infty$ と $n$ が同時に増加する連合漸近的枠組みへと拡張し、$n/\theta \to c$ および $n^2/\theta \to c$ を含むさまざまなスケーリング枠組みにおいて関数中心極限定理を証明する。主な貢献は、$n$ と $\theta$ が同時に成長する下でのアレル的分割統計量に対する厳密な関数極限定理の確立である。

ABSTRACT

The Ewens sampling formula was firstly introduced in the context of population genetics by Warren John Ewens in 1972, and has appeared in a lot of other scientific fields. There are abundant approximation results associated with the Ewens sampling formula especially when one of the parameters, the sample size $n$ or the mutation parameter $ heta$ which denotes the scaled mutation rate, tends to infinity while the other is fixed. By contrast, the case that $ heta$ grows with $n$ has been considered in a relatively small number of works, although this asymptotic setup is also natural. In this paper, when $ heta$ grows with $n$, we advance the study concerning the asymptotic properties of the total number of alleles and of the counts of components in the allelic partition assuming the Ewens sampling formula from the viewpoint of Poisson approximations.

研究の動機と目的

  • 標本サイズ $n$ と突然変異パラメータ $\theta$ が同時に増加する場合に、Ewens標本公式の古典的ポアソン近似結果を拡張すること。
  • 特にポアソン過程近似の観点から、$n$ と $\theta$ が同時に成長する下でのアレル総数 $K_n$ および成分数 $C_n^b$ の漸近的挙動を調査すること。
  • Ewens標本公式の関数中心極限定理を、$\theta$ が $n$ と共に増加する領域に一般化すること。$n/\theta \to c > 0$ および $n^2/\theta \to c > 0$ の場合を含む。
  • ポアソン過程および再生過程の技術を用いて、正規化されたアレル的分割過程が $L^2(0,1)$ でブラウン運動の極限に弱収束することを確立すること。

提案手法

  • Ewens標本公式に対するポアソン過程近似を用い、Arratia, Barbour, and Tavar\'e (1992) の結果を $n, \theta \to \infty$ の連合領域に拡張する。
  • 正規化された計数過程 $X_n(u)$ の弱収束を $B(u)/\sqrt{u}$ に $L^2(0,1)$ で用いる関数中心極限定理の技術を適用する。
  • 上昇階乗 $(\theta)_n$ およびガンマ関数比の漸近展開を用いて、モーメントおよび収束速度を分析する。
  • 一般のスケーリング $f(n)$ の下で、非ポアソン型強度関数 $s_n(u)$ を扱うための一般化されたポアソン過程収束補題(補題 A.4)を導入する。
  • 正規化されたアレルカウントにおける全 Variation 距離および $L^2$-ノルムの収束を、期待値および分散の境界を用いて分析する。
  • $C_n^j$ をポアソン確率変数 $N_1(u\theta \log n)$ と比較し、$L^2$-ノルムで差を分析することで、主要な近似を得る。

実験結果

リサーチクエスチョン

  • RQ1$n$ と $\theta$ が両方とも増加するとき、アレル総数 $K_n$ および成分数 $C_n^b$ の漸近的挙動はいかなるものか?
  • RQ2Ewens標本公式に対するポアソン過程近似を、$n, \theta \to \infty$ の連合漸近的枠組みに拡張可能か?
  • RQ3さまざまなスケーリング枠組み下で、正規化されたアレル的分割過程 $X_n(u)$ の関数的極限挙動は何か?
  • RQ4アレルカウント過程が $\theta$ が $n$ と共に増加する下で $L^2(0,1)$ でブラウン運動の極限に弱収束するか?
  • RQ5真のプロセスと近似プロセスとの間の全 Variation 距離が 0 に近づく条件は何か?

主な発見

  • スケーリング $\theta \sim c \log n$ の下で、$n, \theta \to \infty$ の下で正規化されたアレル的分割過程 $X_n(u)$ は $L^2(0,1)$ で $B(u)/\sqrt{u}$ に弱収束する。
  • $n/\theta \to c > 0$ の場合、過程 $X_n(u)$ は $B(u)/\sqrt{u}$ に弱収束し、関数中心極限定理を確立する。
  • 条件 $\theta^2/n \to 0$ の下で、真のアレルカウント過程とそのポアソン近似との間の全 Variation 距離は 0 に近づき、良好な近似品質が保証される。
  • 本稿では $\|X_n - P^\circ_5\|_{L^2} \to_p 0$ を証明し、正規化過程がブラウン運動の極限に収束することを確認する。
  • $n^2/\theta \to c > 0$ の条件下では、$X_n(u)$ とその極限との差の $L^2$-ノルムの収束速度が $O(\theta^{-1/2})$ で制御される。
  • $(\theta)_n / n!$ の漸近展開として、$n^{\theta-1} \left(1 + \frac{\theta(\theta-1)}{2n} + O(\theta^4/n^2)\right)$ が得られ、証明におけるモーメント解析を支援する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。