Skip to main content
QUICK REVIEW

[論文レビュー] Annotated Bibliography of Some Papers on Combining Significances or p-values

R. Cousins|ArXiv.org|May 15, 2007
Statistical Methods in Clinical Trials参考文献 38被引用数 39
ひとこと要約

この註釈付き参考文献目録は、特に高エネルギー物理学や遺伝学の文脈において、複数の独立した実験からのp値または有意水準を組み合わせるための主要な統計的手法を収集・評価したものである。フィッシャーの方法、ストーファーのzスコア法、重み付き組み合わせ(例:グッド、リプタック)および切断に基づく変種をレビューし、手法の選択は効果量、標本サイズ、対立仮説に関する仮定に依存することを強調している。精度の違いが分かっている場合には、重み付き手法が一般に検出力の向上をもたらす。

ABSTRACT

A question that comes up repeatedly is how to combine the results of two experiments if all that is known is that one experiment had a n-sigma effect and another experiment had a m-sigma effect. This question is not well-posed: depending on what additional assumptions are made, the preferred answer is different. The note lists some of the more prominent papers on the topic, with some brief comments and excerpts.

研究の動機と目的

  • 完全なデータが得られない状況下で、独立した実験からのp値または有意水準を組み合わせることの不適切な性質に対処すること。
  • 最適な手法が相対的精度、標本サイズ、対立仮説といった追加の仮定に依存することを明確にすること。
  • 特に高エネルギー物理学や遺伝学のような分野において、p値を組み合わせる代表的な統計的手法を収集し、批判的に評価すること。
  • p値が証拠の尺度としての限界を強調し、可能な限り一次データを使用することの重要性を指摘すること。
  • 文脈と仮定に基づいて適切な組み合わせ手法を選択できるように、研究者に参考ガイドを提供すること。

提案手法

  • 帰無仮説の下で、検定統計量を一様分布に変換するための確率積分変換を用いる。
  • フィッシャーの方法をレビューし、p値の積を用いて組み合わせ、-2ln(p)の和を自由度2kのカイ二乗分布に変換する。
  • ストーファーのzスコア法を適用し、p値を標準正規偏差に変換し、重み付き和を計算した後、再びp値に変換する。
  • 既知の分散または標本サイズを組み込むことで検出力を向上させる重み付き組み合わせ手法(例:グッド, 1955; リプタック, 1958)を導入する。
  • 非常に大きなp値を除外することで、強力な信号への感受性を高める切断法(例:Zaykin et al., 2002)を検討する。
  • シミュレーションと理論的分析を通じて、さまざまな対立仮説および標本サイズの下での性能を評価する。

実験結果

リサーチクエスチョン

  • RQ1p値と標本サイズしか入手できない状況で、2つ以上のp値をどのように組み合わせるのが最適か?
  • RQ2フィッシャー、ストーファー、重み付き、切断法といった異なる組み合わせ手法は、統計的検出力と第一種の過誤制御においてどのように比較されるか?
  • RQ3相対的精度や標本サイズに差がある場合、重み付き手法が非重み付き手法を上回る条件は何か?
  • RQ4なぜ一部の手法(例:フィッシャーの方法)は等しい重みを仮定するのか?この仮定が無効となる状況はどのようなときか?
  • RQ5離散的または統計量が少ないデータ(例:高エネルギー物理学におけるポisson分布に従うイベント)は、標準的な組み合わせ手法の妥当性と性能にどのように影響を与えるか?

主な発見

  • フィッシャーの方法は、ある種の正則性条件下では尤度比検定と同等であり、非情報的事前分布を用いたベイズ検定の特殊ケースである。
  • 個々のp値が類似している場合、ストーファーの方法はフィッシャーの方法よりもより有意な統合p値をもたらすが、p値のばらつきが大きい場合にはフィッシャーの方法がより検出力が高いことがある。
  • グッド(1955)やリプタック(1958)の重み付き手法は、実験の精度や標本サイズに差がある場合に検出力を向上させ、分散比が既知の下では最適である。
  • 切断に基づく手法(例:Zaykin et al., 2002)は、少数の大きなp値がある場合に、標準的なフィッシャーの方法を上回る性能を示すことがある。これは、強力な信号が希釈されのを回避するからである。
  • 手法の選択は文脈に強く依存する。標本サイズや分散に顕著な差がある場合には、等しい重みを仮定する手法は非効率である。
  • ストーファーの方法は、初期に社会学的研究の脚注に初めて提示されたが、歴史的にも不明瞭な起源を持つが、メタアナリシスの基盤的役割を果たしている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。