Skip to main content
QUICK REVIEW

[论文解读] Adaptive FDR control under independence and dependence

Gilles Blanchard, Étienne Roquain|ArXiv.org|Jul 4, 2007
Statistical Methods in Clinical Trials参考文献 32被引用 33
一句话总结

本文提出了一类新的自适应多重假设检验程序,可在独立和正相关p值下控制错误发现率(FDR)。通过将原假设比例($ olimits_0$)的估计量整合到逐步提升程序中,作者在$ olimits_0$较小时显著提升了统计功效,同时在PRDS和未指定依赖结构下提供了理论保证,确保了FDR控制。

ABSTRACT

In the context of multiple hypotheses testing, the proportion $π_0$ of true null hypotheses in the pool of hypotheses to test often plays a crucial role, although it is generally unknown a priori. A testing procedure using an implicit or explicit estimate of this quantity in order to improve its efficency is called adaptive. In this paper, we focus on the issue of False Discovery Rate (FDR) control and we present new adaptive multiple testing procedures with control of the FDR. First, in the context of assuming independent $p$-values, we present two new procedures and give a unified review of other existing adaptive procedures that have provably controlled FDR. We report extensive simulation results comparing these procedures and testing their robustness when the independence assumption is violated. The new proposed procedures appear competitive with existing ones. The overall best, though, is reported to be Storey's estimator, but for a parameter setting that does not appear to have been considered before. Second, we propose adaptive versions of step-up procedures that have provably controlled FDR under positive dependences and unspecified dependences of the $p$-values, respectively. While simulations only show an improvement over non-adaptive procedures in limited situations, these are to our knowledge among the first theoretically founded adaptive multiple testing procedures that control the FDR when the $p$-values are not independent.

研究动机与目标

  • 开发自适应多重假设检验程序,在原假设比例($\pi_0$)较小时控制FDR并提升统计功效。
  • 将现有FDR控制方法扩展至p值间存在正相关或未指定相关性的场景,传统方法在这些情况下可能失效。
  • 提供理论基础坚实的自适应程序,即使在$\pi_0$未知且需估计时,仍能保持FDR控制。
  • 评估自适应程序在独立性假设被违反时的稳健性与性能表现。
  • 统一回顾现有在独立性假设下的自适应FDR程序,提供全面的比较框架。

提出的方法

  • 在独立性假设下,通过将$\pi_0$的估计值纳入阈值规则,提出两种新的自适应逐步提升程序,相较于非自适应方法显著提升功效。
  • 通过将固定显著性水平$\alpha$替换为$\alpha / \hat{\pi}_0$(其中$\hat{\pi}_0$为$\pi_0$的估计量),对线性逐步提升程序进行自适应调整,确保在独立性下实现FDR控制。
  • 通过基于类似先验分布构造的一族阈值函数,提出在正相关回归依赖(PRDS)和一般依赖结构下的自适应逐步提升程序,确保FDR控制。
  • 使用广义逆函数$F_\kappa^{-1}(t)$来界定错误发现的期望比例,借助集中不等式实现FDR的理论控制。
  • 应用概率引理(如马尔可夫不等式与随机优势不等式)将FDR以$\pi_0$及估计量的性质进行界定。
  • 通过模拟研究比较不同$\pi_0$取值和依赖结构下的性能表现,评估稳健性与功效。

实验结果

研究问题

  • RQ1能否设计出自适应FDR程序,在估计$\pi_0$的同时,在$\pi_0$较小时实现FDR控制并提升功效?
  • RQ2当独立性假设被违反时,特别是存在正相关性时,自适应程序的表现如何?
  • RQ3是否存在理论依据充分的自适应程序,可在未指定依赖结构下控制FDR?
  • RQ4在独立性假设下,不同$\pi_0$估计量(如Storey估计量、插补估计量)在自适应FDR控制中的相对性能如何?
  • RQ5当p值不独立时,能否在自适应程序中控制FDR?需要满足何种条件?

主要发现

  • 所提出的自适应程序在独立性和正相关性(PRDS)下均能控制FDR,理论保证基于随机优势与矩界分析。
  • 在模拟中,当采用此前未探索的参数设置时,Storey估计量表现优于其他自适应程序,实现了功效与FDR控制的最佳平衡。
  • 在未指定依赖结构下,基于一族阈值函数的自适应逐步提升程序仍能保持FDR控制,是首个为此类设定提供理论基础的自适应程序。
  • 模拟结果表明,新程序对独立性假设的中等程度违反具有稳健性,但在高度相关设定下,相较于非自适应方法的性能提升有限。
  • 理论分析证实,只要估计量满足特定随机优势条件,即使$\pi_0$被估计,自适应程序的FDR仍被限定在$\alpha$以内。
  • 广义逆函数$F_\kappa^{-1}(t)$的使用通过将估计量的尾部行为与错误发现的期望数量关联,实现了对FDR的紧密控制。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。