Skip to main content
QUICK REVIEW

[論文レビュー] Flexible Multiple Testing with the FACT Algorithm

Edgar Dobriban|arXiv (Cornell University)|Jun 26, 2018
Statistical Methods in Clinical Trials参考文献 35被引用数 3
ひとこと要約

この論文は、対称性と単調性を活用することで、大規模データセットにおける家族誤差率を制御する柔軟で強力な複数仮説検定手法、Fast Closed Testing (FACT) アルゴリズムを紹介する。この手法により、古典的な閉検定原理の効率的適用が可能となり、強力な信号および中程度の信号の両方を検出する能力に優れ、シミュレーションおよび虚血性心疾患の全ゲノム関連解析においてその有効性が示された。

ABSTRACT

Modern high-throughput science often leads to multiple testing problems: researchers test many hypotheses, wishing to find the significant discoveries. The development of flexible multiple testing methods is thus a central problem in statistics. In this paper, we introduce the new Fast Closed Testing (FACT) method for multiple testing, controlling the family-wise error rate. Our method relies on symmetry and monotonicity to enable the classical closed testing principle in the important setting of large datasets. As the closed testing principle is more than 40 years old, we find it surprising that this simple and fundamental algorithm has not been described before. Our FACT method is general and flexible, and can be used to design powerful new architectures for multiple testing. We showcase it by proposing the Simes-Higher Criticism fusion test, which is powerful for detecting both a few strong signals, and also many moderate signals. We illustrate the method in simulations and in a genome-wide association study of coronary artery disease, and obtain more power than with existing methods.

研究の動機と目的

  • 高スループットの科学的データにおける複数検定の課題に対処すること。従来の手法はしばしば検出力やスケーラビリティに欠ける。
  • 対称性と単調性を活用することで、かつて大規模な設定であまり使われてこなかった古典的な閉検定原理を、効率的に再活性化すること。
  • 多様な科学的応用に適した強力で柔軟な複数仮説検定アーキテクチャの設計を可能にする一般化されたフレームワークの構築。
  • 少数の強い信号と多数の中程度の信号の両方を効果的に検出する能力の向上。既存の手法はしばしばこのバランスをうまく取れていない。

提案手法

  • FACTアルゴリズムは、対称性と単調性を活用して、大規模な複数仮説検定における計算コストを削減する閉検定原理を適用する。
  • すべての仮説の交差集合を計算的に効率的にテストすることで、正確な家族誤差率制御を実現する。
  • 検定統計量の構造を活用して重複計算を回避し、高次元データへのスケーラビリティを実現する。
  • 柔軟な検定統計量をサポートし、Simes検定やハイヤーキリシズムなど、さまざまな周辺検定と組み合わせて融合検定を構築できる。
  • Simes-ハイヤーキリシズム融合検定は、強い信号と中程度の信号の両方に感度が高い新しいアーキテクチャとして提案される。
  • アルゴリズムは汎用的設計となっており、既存の複数仮説検定手順と統合可能でありながら、強い誤差率制御を維持する。

実験結果

リサーチクエスチョン

  • RQ1数千~数百万の仮説を含む現代の高スループットデータセットに、古典的な閉検定原理を効率的に適用できるか?
  • RQ2検定統計量における対称性と単調性をどのように活用すれば、誤差率制御を損なわず閉検定を高速化できるか?
  • RQ3多様な信号パターンにわたって強い誤差率制御を維持しつつ、検出力を向上させる統一されたフレームワークを構築できるか?
  • RQ4この効率的な閉検定アプローチを活用して、どのような新しい複数仮説検定アーキテクチャを設計できるか?
  • RQ5実世界のゲノムデータにおいて、FACT手法は既存の複数仮説検定手順に比べてどの程度の検出力の優位性を示すか?

主な発見

  • FACTアルゴリズムは、対称性と単調性を活用することで、大規模な複数仮説検定において正確な家族誤差率制御を実現する。
  • 計算コストの大幅な削減を達成しており、全ゲノム関連解析のような高スループット応用に閉検定を実用可能としている。
  • FACTによって実現されたSimes-ハイヤーキリシズム融合検定は、少数の強い信号と多数の中程度の信号の両方を検出する能力に優れている。
  • 虚血性心疾患の全ゲノム関連解析において、FACTは既存の手法よりも多くの有意な関連を同定した。実用的有用性が裏付けられた。
  • シミュレーションにより、FACTは競合手法に比べて高い統計的検出力と、強い誤差率制御を両立していることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。