[论文解读] Optimal Inference After Model Selection
本文提出了选择性推断方法,控制模型选择后的第一类错误率,确保在自适应模型选择后仍能进行有效的统计推断。通过利用指数族中的经典最优检验理论,推导出最有力的无偏检验与置信区间,包括针对线性回归的新选择性 z 检验和 t 检验,其统计功效优于现有方法,同时保持频率性质。
To perform inference after model selection, we propose controlling the selective type I error; i.e., the error rate of a test given that it was performed. By doing so, we recover long-run frequency properties among selected hypotheses analogous to those that apply in the classical (non-adaptive) context. Our proposal is closely related to data splitting and has a similar intuitive justification, but is more powerful. Exploiting the classical theory of Lehmann and Scheffé (1955), we derive most powerful unbiased selective tests and confidence intervals for inference in exponential family models after arbitrary selection procedures. For linear regression, we derive new selective z-tests that generalize recent proposals for inference after model selection and improve on their power, and new selective t-tests that do not require knowledge of the error variance.
研究动机与目标
- 解决自适应模型选择后推断无效的问题,传统方法因选择引起的偏差而失效。
- 形式化并控制选择性第一类错误率——即给定假设被选中后拒绝原假设的概率。
- 在任意选择程序后,为指数族模型开发最优、强大且有效的推断程序。
- 通过最大化统计功效并保持错误率控制,改进数据分割和现有选择性推断方法。
- 提供一种通用的推断框架,确保所提问题被提出时推断有效,恢复自适应设置下的长期频率性质。
提出的方法
- 提出控制选择性第一类错误率,定义为给定原假设被选中后拒绝它的概率。
- 应用莱曼与谢弗(Lehmann 和 Scheffé,1955)的经典理论,推导出在选择条件下指数族模型中最有力的无偏检验。
- 推导出新的选择性 z 检验,适用于线性回归,其功效优于先前方法。
- 提出选择性 t 检验,无需已知误差方差,增强了实际应用的可行性。
- 使用数据切割(data carving)方法,通过利用选择数据集中的剩余信息,优于传统数据分割方法。
- 将推断条件化于所选模型,并利用条件分布确保有效的覆盖概率和错误率控制。
实验结果
研究问题
- RQ1当假设的选择依赖于数据时,如何定义并控制统计推断中的错误率?
- RQ2在自适应推断中,应控制何种错误率?它与经典第一类错误率有何不同?
- RQ3我们能否推导出在任意模型选择程序后仍既强大又有效的最优检验?
- RQ4如何在统计功效和效率方面改进数据分割和现有选择性推断方法?
- RQ5条件化在确保选择后有效推断中起什么作用?如何高效实现?
主要发现
- 选择性第一类错误率,即给定选择后错误拒绝原假设的概率,是模型选择后推断的自然且合理的准则。
- 所提方法将该错误率控制在水平 α,确保其长期频率性质与经典推断类似。
- 对于线性回归,新提出的选择性 z 检验在保持有效错误控制的同时,比现有方法具有更高的统计功效。
- 本文推导出的选择性 t 检验无需已知误差方差,使其在实际应用中更具实用性。
- 数据切割方法通过利用选择数据集中的信息,相比数据分割更具统计功效。
- 理论结果表明,FWER 控制并不意味着选择性错误率的控制,凸显了在自适应设置中专门控制选择性错误率的必要性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。