[論文レビュー] Controlling FDR while highlighting distinct discoveries
Focussed BH は、複数の仮説検定結果に対して事前に指定されたフィルタを適用しながら、発見誤り率(FDR)を制御する新しい手法であり、仮説に構造的関係(例:ICD、GO)がある場合でも統計的妥当性を保つ。正の従属性と単調性の条件下で FDR 制御を保証し、冗長性を低減するが推論的保証を損なわない原理的解決策を提供する。
Scientific hypotheses in a variety of applications have domain-specific structures, such as the tree structure of the International Classification of Diseases (ICD), the directed acyclic graph structure of the Gene Ontology (GO), or the spatial structure in genome-wide association studies. In the context of multiple testing, the resulting relationships among hypotheses can create redundancies among rejections that hinder interpretability. This leads to the practice of filtering rejection sets obtained from multiple testing procedures, which may in turn invalidate their inferential guarantees. We propose Focused BH, a simple, flexible, and principled methodology to adjust for the application of any pre-specified filter. We prove that Focused BH controls the false discovery rate under various conditions, including when the filter satisfies an intuitive monotonicity property and the p-values are positively dependent. We demonstrate in simulations that Focused BH performs well across a variety of settings, and illustrate this method's practical utility via analyses of real datasets based on ICD and GO.
研究の動機と目的
- 木構造やグラフのようなドメイン固有の構造を持つ仮説を対象とした多重仮説検定における解釈可能性の課題に対処すること。
- 冗長性を低減するために再検定セットをフィルタリングするのと、有効な統計的推論を維持するという矛盾を解消すること。
- 任意の事前に指定されたフィルタを適用した複数の仮説検定結果に対して、FDR 制御を保持する手法を開発すること。
- p 値の正の従属性とフィルタの直感的な単調性の下でも、手法が有効であることを保証すること。
- 生物医学分類やゲノム分野を含む多様な分野に適用可能な柔軟で原理的なフレームワークを提供すること。
提案手法
- Focussed BH は、仮説に適用される構造とフィルタに基づいて p 値の閾値を調整することで、Benjamini-Hochberg 手順を変更する。
- フィルタ固有の調整を導入し、非特徴的または冗長な発見を除外した後でも FDR が制御されることを保証する。
- この手法は、フィルタの単調性特性に依存しており、仮説が再検定された場合、その階層上のすべての先祖も同様に考慮されるように保証する。
- p 値の部分集合に対する正の回帰従属性(PRDS)の仮定の下で FDR 制御を証明する。これは多重仮説検定で一般的な仮定である。
- このアプローチは特定のフィルタに依存せず、任意の事前に指定されたルール(例:階層内の葉ノードのみを選択する、特定の枝を選択する)に適用可能である。
- 手順は計算的に効率的であり、元の BH 手順の単純さを保ちながら、構造的認識を追加する。
実験結果
リサーチクエスチョン
- RQ1再検定セットをフィルタリングすることで解釈性を向上させつつ、FDR 制御が無効にならないか?
- RQ2どのような条件下でフィルタリングされた再検定セットでも、依然として有効な FDR 制御が保たれるか?
- RQ3ドメイン構造を持つフィルタを仮説に適用する際、どのようにして FDR 閾値を正式に調整できるか?
- RQ4p 値間に正の従属性がある場合でも、この手法は有効であるか?これは実データで一般的な状況である。
- RQ5ICD や遺伝子オントロジーのような多様な構造的仮説空間に、このアプローチを柔軟に適用できるか?
主な発見
- Focussed BH は、p 値の正の従属性とフィルタの単調性の下で FDR を制御し、統計的妥当性を保証する。
- 冗長または非特徴的な発見を除外した後でも、強力な FDR 制御を維持し、解釈性を向上させる。
- シミュレーションにより、Focussed BH が多様なデータ構造とフィルタリングルールで良好に機能することが示された。
- ICD や遺伝子オントロジーの実データ解析において、Focussed BH は、FDR 制御を保ちながら、明確で意味のある発見を的確に抽出した。
- このアプローチは、さまざまなフィルタータイプに対して頑健であり、データの下位分布に関する仮定を必要としない。
- この手法は、推論的保証を損なうことがよくあるアドホックなフィルタリングの代替として、原理的かつ有効な選択肢を提供する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。