Skip to main content
QUICK REVIEW

[论文解读] Ratios: A short guide to confidence limits and proper use

Volker H. Franz|ArXiv.org|Oct 10, 2007
Scientific Measurement and Uncertainty Evaluation参考文献 73被引用 49
一句话总结

本文提供了计算测量变量比率置信区间的全面指南,主张使用费勒定理和自助法,而非常被使用但存在缺陷的指数法和零方差法。通过模拟表明,不当方法可能导致严重不准确的覆盖率,强调在使用比率前应通过检验线性关系中的非零截距来避免虚假相关性。

ABSTRACT

Researchers often calculate ratios of measured quantities. Specifying confidence limits for ratios is difficult and the appropriate methods are often unknown. Appropriate methods are described (Fieller, Taylor, special bootstrap methods). For the Fieller method a simple geometrical interpretation is given. Monte Carlo simulations show when these methods are appropriate and that the most frequently used methods (index method and zero-variance method) can lead to large liberal deviations from the desired confidence level. It is discussed when we can use standard regression or measurement error models and when we have to resort to specific models for heteroscedastic data. Finally, an old warning is repeated that we should be aware of the problems of spurious correlations if we use ratios.

研究动机与目标

  • 解决心理学和生物医学研究中比率置信区间方法的广泛误用问题。
  • 识别并纠正常用方法(如指数法和零方差法)中的缺陷。
  • 推广适当的统计方法——特别是费勒定理和自助技术——用于正态和非正态分布下的比率估计。
  • 强调在比率用于具有非零截距的线性相关变量时,可能出现虚假相关性的风险。
  • 根据数据结构和假设,提供何时使用回归模型、指数或基于比率的方法的实用指导。

提出的方法

  • 应用费勒定理计算正态分布随机变量比率的置信区间,并通过几何解释提供直观理解。
  • 当分母远离零且正态性成立时,使用泰勒级数近似(泰勒法)作为更简单的替代方法。
  • 对非正态数据或分母接近零的情况,采用特殊自助法(如黄-自助法)以提高覆盖率的准确性。
  • 通过蒙特卡洛模拟,在各种分布假设和样本量下比较不同方法的性能。
  • 通过回归诊断检验零截距假设的有效性,以避免比率分析中的虚假相关性。
  • 建议在比率假设不成立时,使用具有非零截距的线性模型,而非强制使用基于比率的推断。

实验结果

研究问题

  • RQ1当分母接近零或服从正态分布时,比率置信区间的统计特性如何?
  • RQ2在现实数据条件下,指数法和零方差法在覆盖率概率方面的表现如何?
  • RQ3费勒定理在什么情况下是比率置信区间的最优方法?与基于自助法的替代方法相比如何?
  • RQ4在何种条件下可以使用标准回归模型来估计比率?在存在异方差性或非零截距时又应避免使用?
  • RQ5当对具有非零截距的线性相关变量使用比率或指数时,虚假相关性的风险是什么?

主要发现

  • 当分母未以指数法所假设的特定方式呈现异方差性时,指数法可能产生覆盖率远低于名义水平的置信区间。
  • 零方差法问题更为严重,常因忽略分子和分母的抽样变异性,导致严重过于保守的区间。
  • 模拟结果表明,费勒方法在正态性下能保持适当的覆盖率,并在分母接近零时提供可靠的替代方案。
  • 当分母远离零且正态性成立时,泰勒法为指数法提供了一种简单而准确的替代方案。
  • 自助法,特别是黄-自助法,在非正态数据或分母分布具有高峰度或偏度时表现有效。
  • 当对具有非零截距的线性相关变量使用比率时,会引发虚假相关性,导致标准误偏差和误导性推论,尤其在医学和心理学指数中风险显著。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。