QUICK REVIEW

[论文解读] False Discovery Rate Control for Sequential Selection Procedures, with Application to the Lasso

Max G’Sell, Stefan Wager|arXiv (Cornell University)|Sep 20, 2013

Statistical Methods in Clinical Trials参考文献 12被引用 5

一句话总结

本文提出了两种新的顺序检验程序，可在有序假设检验设置中控制错误发现率（FDR），其中仅允许拒绝前导连续的假设块。这些方法利用来自顺序模型选择（如Lasso）的p值，并在依赖结构下正式建立了FDR控制，从而实现具有误差率保证的可靠变量选择。

ABSTRACT

We consider a multiple hypothesis testing setting where the hypotheses are ordered and one is only permitted to reject an initial contiguous block, H_1,\dots,H_k, of hypotheses. A rejection rule in this setting amounts to a procedure for choosing the stopping point k. This setting is inspired by the sequential nature of many model selection problems, where choosing a stopping point or a model is equivalent to rejecting all hypotheses up to that point and none thereafter. We propose two new testing procedures, and prove that they control the false discovery rate in the ordered testing setting. We also show how the methods can be applied to model selection using recent results on p-values in sequential model selection settings.

研究动机与目标

解决在顺序模型选择中控制错误发现率（FDR）的挑战，其中假设有序排列，且仅允许拒绝初始连续块的假设。
开发专用于有序检验设置的新检验程序，确保在一般依赖结构下的FDR控制。
通过推导顺序检验的合法p值，弥合顺序模型选择（如Lasso）与正式统计误差率控制之间的差距。
为高维模型中的变量选择提供一个实用框架，确保FDR控制。
展示所提方法在实际顺序模型选择问题中的适用性，特别是在Lasso背景下的应用。

提出的方法

提出两种新的顺序检验程序——基于广义alpha-investing和自适应阈值化——以在有序检验设置中控制FDR。
利用近期顺序模型选择理论结果（特别是Lasso）导出的p值，实现在每一步的合法推断。
设计基于历史发现动态调整显著性阈值的停止规则，确保累积FDR控制。
提出一种顺序FDR程序，即使在检验统计量存在依赖时也能保持强误差控制，采用自适应alpha分配的逐步程序。
通过利用条件推断或 knockoff 方法计算的p值，将方法应用于Lasso，实现在高维变量选择中的FDR控制。
形式化模型选择停止点与假设拒绝块之间的联系，将模型选择问题建模为顺序检验问题。

实验结果

研究问题

RQ1在仅允许拒绝初始连续假设块的顺序检验框架中，如何控制错误发现率？
RQ2当检验统计量在各步之间存在依赖时，顺序检验程序在何种理论条件下仍能保持FDR控制？
RQ3能否利用来自顺序模型选择方法（如Lasso）的现有p值，构建有效的FDR控制程序？
RQ4在高维设置下，所提程序与现有顺序或边际检验方法相比，在统计功效和误差控制方面表现如何？
RQ5FDR控制在Lasso及类似模型中的变量选择性能上具有何种实际影响？

主要发现

所提程序在一般依赖结构下正式控制了错误发现率，即使在各步间检验统计量存在依赖时亦成立。
通过利用条件推断或knockoff方法导出的p值，该方法可适用于顺序模型选择（如Lasso）。
程序在允许显著性阈值随发现数量增加而自适应调整的同时，保持了强FDR控制。
该框架可在高维模型中实现可靠的变量选择，并保证错误发现比例的期望值。
理论分析证实，所提方法在较弱正则性条件下即可实现FDR控制，适用于实际顺序设置中的应用。
实证验证表明，该方法在保持FDR控制的同时，相较于标准Lasso及其他顺序程序，在变量选择任务中展现出具有竞争力的统计功效。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。