Skip to main content
QUICK REVIEW

[论文解读] Detecting the skewness of data from the sample size and the five-number summary

Jiandong Shi, Dehui Luo|arXiv (Cornell University)|Oct 12, 2020
Meta-analysis and systematic reviews参考文献 24被引用 30
一句话总结

本文提出三种新的统计检验方法,仅利用样本量和五数概括(中位数、四分位数、最小值/最大值)来检测数据偏度,从而在临床研究中准确识别非正态分布。这些检验方法控制了第一类错误率,并展现出较高的统计功效,提升了对偏态连续结局变量进行元分析的可靠性。

ABSTRACT

For clinical studies with continuous outcomes, when the data are potentially skewed, researchers may choose to report the whole or part of the five-number summary (the sample median, the first and third quartiles, and the minimum and maximum values), rather than the sample mean and standard deviation. For the studies with skewed data, if we include them in the classical meta-analysis for normal data, it may yield misleading or even wrong conclusions. In this paper, we develop a flow chart and three new tests for detecting the skewness of data from the sample size and the five-number summary. Simulation studies demonstrate that our new tests are able to control the type I error rates, and meanwhile provide good statistical power. A real data example is also analyzed to demonstrate the usefulness of the skewness tests in meta-analysis and evidence-based practice.

研究动机与目标

  • 为解决在仅报告五数概括(而非均值和标准差)的临床研究中检测偏度的挑战。
  • 通过识别会偏倚经典正态理论方法的偏态数据,提升元分析的有效性。
  • 开发实用且易于使用的检验方法,仅需基本汇总统计量,以在循证实践中广泛推广。
  • 为研究者提供无需原始数据或完整描述性统计量即可评估数据分布的工具。

提出的方法

  • 作者基于正态分布下五数概括与期望顺序统计量之间的关系,提出三种新的统计检验方法。
  • 检验将观测到的五数概括(中位数、Q1、Q3、最小值、最大值)与基于样本量在正态分布下推导出的理论分位数进行比较。
  • 每种检验使用不同的汇总统计量组合,以评估与对称性的偏离程度,重点关注中位数与四分位数之间的相对位置。
  • 检验设计旨在控制第一类错误率,同时在检测偏度时保持高统计功效。
  • 引入流程图,指导研究者根据可获得的汇总统计量选择最合适的检验方法。
  • 通过模拟研究验证了检验在不同样本量和偏度水平下的表现。

实验结果

研究问题

  • RQ1能否仅使用样本量和五数概括可靠地检测连续数据的偏度?
  • RQ2与现有方法相比,所提出的检验在第一类错误控制和统计功效方面表现如何?
  • RQ3当可获得五数概括的不同子集时,最优的检验选择策略是什么?
  • RQ4这些检验在不同样本量和偏度程度下的表现如何?
  • RQ5这些检验能否提升涉及偏态临床数据的元分析的准确性?

主要发现

  • 所提出的检验在各种样本量和分布形态下均能有效控制第一类错误率。
  • 检验在检测左偏和右偏分布方面均表现出很高的统计功效。
  • 模拟结果证实,即使在小样本至中等样本量下,检验仍保持稳健性能。
  • 流程图显著提升了实用性,可指导研究者根据可用数据选择最合适的检验。
  • 真实数据示例表明,应用这些检验可识别出不应使用正态理论方法合并的偏态研究,从而得出更准确的元分析结论。
  • 检验被证明是循证医学和系统评价中实用且有效的工具。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。