Skip to main content
QUICK REVIEW

[论文解读] On k-FWE-based critical values for controlling the false discovery proportion under dependence

Sylvain Delattre, Étienne Roquain|arXiv (Cornell University)|Nov 15, 2013
Statistical Methods in Clinical Trials参考文献 31被引用 2
一句话总结

本文提出了一种方法,在依赖性条件下控制错误发现比例(FDP),通过适应Romano和Wolf(2007)的基于k-FWE的框架,利用从k-FWE上界推导出的自适应临界值。该方法建立了FDP的有限样本和渐近界,验证了其作为在高维依赖性检验场景中控制FDP的稳健工具的有效性。

ABSTRACT

The false discovery proportion (FDP) is a convenient way to account for false positives in an high dimensional setting where a large number of tests are performed simultaneously. The Benjamini-Hochberg procedure is now widely used and is known to control the expectation of the FDP, called the false discovery rate (FDR). However, when the individual tests are correlated, controlling the FDR can be unsuitable to ensure that the actually achieved FDP is close (or below) the targeted level. This rises the question of controlling the quantiles of the distribution of the FDP, which is a challenging question that has received a growing attention in the recent literature. This paper elaborates upon the general principle let down by Romano and Wolf (2007) (RW) that builds FDP controlling procedures from $k$-family-wise error rate ($k$-FWE) controlling procedures, while incorporating known dependencies in an appropriate manner. This method is revisited as follows: first, choose a device to upper-bound the $k$-FWE, for all $k$. Second, build the corresponding critical values, possibly adaptively to the number $m_0$ of true null hypotheses. Third, use these critical values into a step-wise procedure (either step-down or step-up). The goal of the paper is to study the obtained FDP when using this methodology. Our first result provides sample finite bounds, while our second result is asymptotic in the number $m$ of hypotheses. Overall, this paper can be seen as a validation of RW's paradigm for controlling the FDP under dependence.

研究动机与目标

  • 为解决在高维多重检验中,FDR在依赖性条件下可能无法将实际FDP保持在目标水平附近的问题。
  • 开发一种控制FDP分布分位数的方法,确保在检验统计量存在依赖性时,误差率控制更加可靠。
  • 通过整合已知依赖结构和真实原假设的自适应估计,验证并改进Romano和Wolf(2007)关于FDP控制的范式。
  • 推导在使用基于k-FWE的临界值进行步进/步降程序时,FDP的有限样本和渐近界。

提出的方法

  • 利用所有k的k-FWE上界,构建在依赖性条件下控制FDP的临界值。
  • 自适应估计真实原假设的数量(m₀),以提高临界值的统计功效和精度。
  • 基于推导出的临界值,构建逐步程序(步进或步降),以顺序方式控制FDP。
  • 将已知的依赖结构整合到k-FWE上界计算过程中,以增强FDP控制的有效性和灵敏度。
  • 利用k-FWE框架,对FDP分布施加理论界,涵盖有限样本和m → ∞时的渐近情形。
  • 借鉴Romano和Wolf(2007)方法的一般结构,同时通过引入自适应和依赖感知的改进,实现扩展。

实验结果

研究问题

  • RQ1Romano和Wolf(2007)的基于k-FWE的框架能否在一般依赖性条件下被有效适应,以控制错误发现比例?
  • RQ2在使用基于k-FWE的临界值并结合自适应m₀估计时,FDP的有限样本和渐近界是什么?
  • RQ3将已知依赖结构整合到FDP控制程序中,如何提升其性能?
  • RQ4在何种条件下,所提出的方法能以高概率确保实际FDP低于目标水平?

主要发现

  • 本文建立了在使用基于k-FWE的临界值时,FDP的有限样本上界,为误差控制提供了严格的保证。
  • 推导出FDP的渐近界,表明随着检验数量m的增加,该方法能持续控制FDP分布。
  • 对m₀(真实原假设数量)的自适应估计提高了程序的统计功效,同时不损害FDP控制能力。
  • 该方法被验证为Romano和Wolf(2007)范式的可靠扩展,尤其在依赖性条件下表现优异。
  • 基于推导临界值的逐步程序(步进或步降)在有限样本和渐近情形下均能有效控制FDP。
  • 将依赖信息整合到k-FWE上界计算过程中,显著提升了FDP控制的准确性和鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。