Skip to main content
QUICK REVIEW

[论文解读] New procedures for discrete tests with proven false discovery rate control

Sebastian Döhler, Guillermo Durand|arXiv (Cornell University)|Jun 18, 2017
Statistical Methods in Clinical Trials被引用 1
一句话总结

本文提出了针对离散检验统计量的多重假设检验中新的错误发现率(FDR)控制程序。通过整合离散分布结构与信号强度(π₀自适应),所提出的方法在任意固定数量的原假设下均能确保理论上的FDR控制,模拟和真实数据实验中显著提升了统计功效。

ABSTRACT

We consider the problem of testing simultaneously many null hypotheses when the test statistics have a discrete distribution. We present new modifications of the Benjamini-Hochberg procedure that incorporate the discrete structure of the data in an appropriate way. These new procedures are theoretically proved to control the false discovery rate (FDR) for any fixed number of null hypotheses. A strong point of our FDR controlling methodology is that it allows to incorporate at once the discreteness and the quantity of signal of the data (so called $\pi_0$-adaptation ). Finally, the power advantage of the new methods is demonstrated by using both numerical experiments and real data sets.

研究动机与目标

  • 解决当检验统计量服从离散分布时,标准FDR程序失效所面临的多重假设检验挑战。
  • 开发显式考虑数据分布离散性的FDR控制方法。
  • 将原假设比例(π₀)纳入程序以提升功效,实现π₀自适应。
  • 在任意固定数量的原假设下确保理论FDR控制,这一保证强于渐近控制。
  • 通过数值实验和真实数据应用,展示优越的统计功效。

提出的方法

  • 提出改进的Benjamini-Hochberg程序,根据检验统计量的离散特性调整p值阈值。
  • 利用离散检验统计量的精确分布计算临界值,以维持FDR控制。
  • 在步长提升过程中引入估计的原假设比例(π₀),以适应信号强度。
  • 采用条件错误率方法,考虑每个离散点的概率质量,以优化拒绝阈值。
  • 采用改进的步长提升程序,在每一步使用离散累积分布函数调整临界值。
  • 通过证明在任意固定数量的原假设下,错误发现的期望比例始终被α控制,从而确保FDR控制。

实验结果

研究问题

  • RQ1当检验统计量为离散分布时,如何在多重检验中维持FDR控制?
  • RQ2通过结合检验统计量的离散分布,能否改进FDR控制程序?
  • RQ3在离散多重检验场景中,π₀自适应在多大程度上提升了功效?
  • RQ4在离散分布下,能否对任意固定数量的原假设保证理论FDR控制?
  • RQ5在真实和模拟的离散数据上,新程序与现有方法相比在功效上表现如何?

主要发现

  • 所提出的方法在任意固定数量的原假设下实现了理论FDR控制,其保证强于渐近控制。
  • 结合检验统计量的离散分布可获得更精确的临界值,从而提升功效。
  • 在模拟实验中,该方法相较于标准Benjamini-Hochberg方法及其他离散感知程序展现出显著的功效优势。
  • 引入π₀自适应使程序能够动态适应实际信号水平,从而增强检测功效。
  • 真实数据应用表明,新方法在保持FDR控制的同时识别出更多真实发现。
  • 该方法在各种离散分布和信号强度下均表现稳健,性能一致。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。