Skip to main content
QUICK REVIEW

[论文解读] Randomized Quantile Residuals: an Omnibus Model Diagnostic Tool with Unified Reference Distribution

Cindy Feng, Alireza Sadeghpour|arXiv (Cornell University)|Aug 28, 2017
Advanced Statistical Process Monitoring被引用 5
一句话总结

本文提出随机分位数残差(RQRs)作为一种统一的、服从正态分布的诊断工具,用于评估非正态回归模型的拟合优度。研究表明,当模型正确设定时,RQRs 服从标准正态分布,并通过模拟和真实医疗利用数据的应用,证明其在检测模型不足方面的表现优于传统残差。

ABSTRACT

Examining residuals, such as Pearson and deviance residuals, is a primary method to identify the discrepancies between models and data and to assess the overall goodness-of-fit of a model. In normal linear regression, both of these residuals coincide and are normally distributed; however, in non-normal regression models, the residuals are far from normality, with residuals aligning nearly parallel curves according to distinct response values, which imposes great challenges for visual inspection. Randomized quantile residual was proposed in the literature to circumvent the above- mentioned problems in traditional residuals. However, this approach has not gained deserved awareness and attention, partly due to the lack of extensive empirical studies to investigate its performance. Therefore, we demonstrate the normality of the randomized quantile residual when the fitted model is true and compare its performance with the traditional residuals through a series of simulation studies. Our simulation studies show that randomized quantile residual has a unified normal distribution under the true model, and has great statistical power in detecting many forms of model inadequacies. We illustrate the use of randomized quantile residual in assessing goodness- of-fit of non-normal regression models in a health care utilization study.

研究动机与目标

  • 为解决传统残差(如皮尔逊残差和偏差残差)在非正态回归模型中的局限性,这些残差常表现出非正态模式,从而影响视觉解读。
  • 证明当拟合模型正确时,随机分位数残差遵循统一的标准正态分布,从而实现可靠的模型诊断。
  • 评估 RQRs 在检测各种形式模型不足方面的统计功效,并与传统残差方法进行比较。
  • 通过模拟研究和真实世界医疗利用数据集的实证验证,推动 RQRs 的应用。

提出的方法

  • 提出随机分位数残差(RQRs)作为将预测累积概率转换为标准正态分位数的变换,确保统一的参考分布。
  • 在残差计算中引入随机化步骤,以消除由离散响应分布引起的残差离散跳跃。
  • 通过模拟研究评估在模型正确设定及各种模型误设情况下的 RQRs 分布特性。
  • 使用视觉诊断和统计功效指标,比较 RQRs 与皮尔逊残差和偏差残差在检测拟合不足方面的表现。
  • 采用 Q-Q 图和正式的拟合优度检验,评估 RQRs 的正态性及其对模型偏离的敏感性。
  • 将 RQRs 应用于真实世界的医疗利用数据集,以展示其在模型评估中的实际效用。

实验结果

研究问题

  • RQ1当拟合模型正确时,随机分位数残差是否服从标准正态分布?
  • RQ2RQRs 在检测模型误设方面的统计功效与皮尔逊残差和偏差残差相比如何?
  • RQ3RQRs 是否能有效检测各种类型的模型不足,如错误的连接函数或遗漏的协变量?
  • RQ4在非正态回归模型中,RQRs 在视觉诊断中的表现与传统残差相比如何?

主要发现

  • 当拟合模型正确设定时,随机分位数残差遵循统一的标准正态分布,提供了一致的参考分布。
  • 在多种模拟情景下,RQRs 在检测模型不足方面表现出更优的统计功效,包括错误的连接函数和遗漏变量的情况。
  • 与传统残差不同,RQRs 避免了残差图中出现平行曲线,从而实现了更清晰的模型拟合视觉评估。
  • 模拟研究证实,即使在离散或偏态响应分布下,RQRs 在模型正确设定时仍保持近似正态性。
  • 在医疗利用研究中,RQRs 有效揭示了传统残差诊断未能检测到的模型拟合不足。
  • 该方法在多种指数族分布中表现稳健,为非正态回归模型提供了统一的诊断框架。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。