QUICK REVIEW
[論文レビュー] Weighted Hypothesis Testing
Larry Wasserman, Kathryn Roeder|ArXiv.org|Apr 7, 2006
Statistical Methods in Clinical Trials参考文献 10被引用数 30
ひとこと要約
本稿は、p値に最適な重みを割り当てることで、多重仮説検定における統計的検出力の向上を図る重み付き仮説検定を導入する。家族誤差率および誤発見率の誤差制御を保証する。検出力は重みの誤設定に対して非常に頑健であり、特にスパースな重み設定下で顕著な利点を示す。また、外部情報やデータ分割に基づく重み推定手法を提案し、重みが不適切に選ばれた場合でも検出力の損失が最小限に抑えられる。
ABSTRACT
The power of multiple testing procedures can be increased by using weighted p-values (Genovese, Roeder and Wasserman 2005). We derive the optimal weights and we show that the power is remarkably robust to misspecification of these weights. We consider two methods for choosing weights in practice. The first, external weighting, is based on prior information. The second, estimated weighting, uses the data to choose weights.
研究の動機と目的
- p値に最適な重みを割り当てることで、多重仮説検定における統計的検出力を向上させること。
- 重み付き検定下でも、家族誤差率および誤発見率の制御が保たれることを保証すること。
- 特に、不完全な事前知識を伴う実用的状況下で、重みの誤設定に対する検出力の頑健性を調査すること。
- 外部情報またはデータ分割を用いた実用的な重み選択手法の開発。
- 重みが不適切に推定された場合の最大限の検出力損失を定量化すること、特に非スパースおよびスパースな重み構造下での検出。
提案手法
- 本稿は、一パrameter族の重み分布下で最小検出力を最大化する最適な重みを導出する。
- 片側正規位置モデルを用いて最適な重み構造を導出し、最適な重みが検定統計量のしきい値化ルールに対応することを示す。
- 外部重み付けでは、事前情報(例:滑らかな空間的プロセス)を用い、帰無仮説でない可能性が高い仮説に高い重みを割り当てる。
- 推定重みの場合は、データ分割を用いる:データの一部で重みを推定し、残りで仮説を検定することで、誤差制御を維持する。
- 理論的分析では、ガウス尾部近似および分位数変換を用いて、さまざまな重み設定下での検出力表現を導出する。
- 重みの誤設定時の最大検出力損失を計算することで、頑健性を評価する。特に、帰無仮説が対立仮説と誤認定された場合を重点的に検討する。
実験結果
リサーチクエスチョン
- RQ1誤差制御を保ちつつ、多重仮説検定における統計的検出力を最大化する最適な重み付けスキームは何か?
- RQ2重みの誤設定に対する重み付き検定の検出力はどの程度感度に依存するか?
- RQ3データ分割を用いた重み推定手法は、強い誤差制御を維持し、高い検出力を保持できるか?
- RQ4どのような条件下で、重み付き検定が未重み付き(例:ボンフェローニ補正)手法を上回るか?
- RQ5重みの構造—スパース対非スパース—は、頑健性および検出力性能にどのように影響するか?
主な発見
- 最適な重みは一パrameter族を形成し、再表現された検定統計量のしきい値として、Rubin, van der Laan, and Dudoit (2005) が導出したものと等価である。
- 検出力は重みの誤設定に対して顕著に頑健である:スパースな重みでは正しい場合に大きな利得を得るが、誤っている場合でも最小限の損失にとどまる。
- 非スパースな状況では、最大検出力損失は通常ボンフェローニ検定の検出力よりも優れている。損失は、a(非帰無仮説の割合)およびγ(帰無仮説が対立仮説と誤認定される割合)を用いて、最大でγ/(1−a)の要因で有界である。
- データ分割により重みを推定する場合、家族誤差率はαレベルで制御される。これは条件付き確率およびガウス尾部の境界を用いて証明される。
- すべてのξ < ξ* に対して、重み付き検定はボンフェローニ検定を上回る。ここでξ*は誤差率およびサンプルサイズに依存する閾値であり、対立仮説の平均が中程度の値である場合に特に顕著である。
- 誤設定された重み下での最大検出力損失は、z-分位数およびガウス尾部近似を含む非自明な下限で有界であり、敵対的誤推定下でも検出力損失が制限されることを示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。