QUICK REVIEW

[論文レビュー] Hypothesis testing with e-values

Aaditya Ramdas, Ruodu Wang|arXiv (Cornell University)|Oct 31, 2024

Advanced Statistical Process Monitoring被引用数 5

ひとこと要約

この論文は、仮説検定の基本的なツールとしての e-values の意義を概説し、その定義・性質・p-values との関係を詳述し、逐次、複数検定、リスク評価の文脈での e-values の構築、集約、適用方法を提示する。

ABSTRACT

This book is written to offer a humble, but unified, treatment of e-values in hypothesis testing. It is organized into three parts: Fundamental Concepts, Core Ideas, and Advanced Topics. The first part includes four chapters that introduce the basic concepts. The second part includes five chapters of core ideas such as universal inference, log-optimality, e-processes, operations on e-values, and e-values in multiple testing. The third part contains seven chapters of advanced topics. The book collates important results from a variety of modern papers on e-values and related concepts, and also contains many results not published elsewhere. It offers a coherent and comprehensive picture on a fast-growing research area, and is ready to use as the basis of a graduate course in statistics and related fields.

研究の動機と目的

仮説検定の基礎的なツールとしての e-values の意義と、三つの役割（方法論的、技術的、根本的）を理解することを動機づける。
e-values、p-values、テストを定義し、それらの性質と解釈を p-values と比較対照する。
e-values と p-values とのキャリブレーションを説明し、パワーを持つe-values がパワーを持つテストを導く条件を確立する。
複合的・不規則な検定問題の中核構成として universal inference と log-optimal e-values を導入する。
逐次推論、逐次・多重検定、およびリスク測定予測の文脈における e-values の影響について論じる。

提案手法

e-values を、帰無仮説の下で期待値が最大で1である非負統計量としての定義と解釈。
有効な検定・手続きを導くための e-values と p-values のキャリブレーション。
不規則な検定問題に対する universal inference e-values の構築と、対数最適 e-value（numeraire）。
逐次データのための e-processes および逐次の anytime-valid 推論の発展。
複合 e-values および e-BY/e-BH フレームワークを介した false discovery rate 制御と信頼区間手順への e-values の結びつき。
Bayes 因子、逆情報射影、マルチンゲール法（martingale methods）との関係の説明。

実験結果

リサーチクエスチョン

RQ1e-values とは何か、帰無仮説および対立仮説の下で p-values とはどう関係するのか？
RQ2e-values をどのように p-values にキャリブレーションして、逐次・適応的設定を含む有効な検定を構築するのに用いることができるか？
RQ3universal または log-optimal な e-value とは何か、そしてそれらが複合的・不規則な仮説に対していかに検定力を保証するのか？
RQ4依存する検定間で e-values をどのように統合・結合できるか、そしてそれらが多重検定および FDR 制御をどのように支援するか？
RQ5逐次推論、任意停止、リスク測定検定における e-values の役割は何か？

主な発見

e-values は、単純なしきい値検出（例: E > 1/α）によって有効な検定を生み出す、仮説検定の統一的な枠組みを提供する。
e-values と p-values の間で変換するキャリブレータが存在し、誤り保証を保ちながら相互解釈を可能にする。
Universal inference は不規則な問題のための e-values を生み出し、固定された対立仮説には常に対数最適 e-value が存在する。
E-processes および逐次 e-values は anytime-valid 推論を可能にし、のぞき見や optional stopping による問題を回避する。
複合 e-values は false discovery rate 制御と信頼区間の結合を支え、堅牢な多重検定および FDR 手順を可能にする。
依存の下で e-values の統合・平均化は妥当性を保ち、逐次実験およびリスク評価の応用を支える。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。