Skip to main content
QUICK REVIEW

[论文解读] State of the art in selection of variables and functional forms in multivariable analysis—outstanding issues

Willi Sauerbrei, Aris Perperoglou|PubMed|Jul 1, 2019
Statistical Methods and Inference参考文献 93被引用 32
一句话总结

本文综述了多变量回归模型中变量和函数形式选择的当前实践与挑战,突出显示了广泛存在的方法论不一致性和缺乏基于证据的指导。文章提出一个框架以识别关键未解决的问题,并呼吁对替代方法进行严格比较,以指导统计建模的最佳实践。

ABSTRACT

Selection of variables and of functional forms are important topics in multivariable analysis. To define a state of the art and to provide evidence-supported guidance to researchers who have only a basic level of statistical knowledge, further comparative research is required.

研究动机与目标

  • 识别并阐明多变量回归模型中变量和函数形式选择方面尚未解决的方法论问题。
  • 为具备基本统计知识的研究人员提供易于理解、基于证据的指导。
  • 突出当前实践中存在的缺陷,特别是对传统、非系统性方法的过度依赖。
  • 通过概述七个需要研究的关键主题,激发进一步研究。
  • 提高在应用研究中,特别是在医学和健康科学领域,多变量模型的可靠性和有效性。

提出的方法

  • 对多变量分析中现有变量选择和函数形式确定方法的系统性综述。
  • 使用两个真实世界的医学案例来说明模型构建中的常见陷阱。
  • 将传统方法(例如逐步选择)与现代替代方法(例如限制性立方样条、LASSO)进行比较。
  • 强调模型验证和校准在评估性能方面的重要性。
  • 整合STRATOS倡议的见解,以确保方法论的严谨性和实际相关性。
  • 使用适度的技术语言,使研究成果对广大实践者和学生群体易于理解。

实验结果

研究问题

  • RQ1传统、非系统性的变量选择方法在多变量建模中的主要缺陷是什么?
  • RQ2对连续预测变量的不同建模方法(例如分类 vs. 样条方法)如何影响模型性能和解释?
  • RQ3现有证据表明,LASSO或稳定性选择等现代变量选择技术的相对表现如何?
  • RQ4如何在单一建模策略中合理地结合变量选择与函数形式确定?
  • RQ5在变量和函数形式选择方面,哪些是最关键的未解决研究问题,需要进一步调查?

主要发现

  • 目前尚缺乏充分的实证证据来推荐某一种方法优于其他方法用于多变量模型中的变量或函数形式选择。
  • 传统方法如逐步选择被广泛使用,但已知会产生有偏估计并导致无效推断。
  • 通常不建议对连续变量进行分类,因为这会损失信息并降低统计功效。
  • 现代方法如限制性立方样条和惩罚回归(例如LASSO)表现更优,但仍需进一步的比较评估。
  • 变量选择与函数形式确定的整合仍处于发展初期,缺乏标准化的最佳实践。
  • 确定了七个关键研究主题,亟需深入调查以推进多变量建模的方法论标准。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。