Skip to main content
QUICK REVIEW

[논문 리뷰] Detecting the skewness of data from the sample size and the five-number summary

Jiandong Shi, Dehui Luo|arXiv (Cornell University)|2020. 10. 12.
Meta-analysis and systematic reviews참고 문헌 24인용 수 30
한 줄 요약

이 논문은 임상 연구에서 평균과 표준편차 대신 표본 크기와 오목수치 요약(중위수, 사분위수, 최솟값/최댓값)만 제공되는 경우, 비정규분포를 정확하게 식별할 수 있도록 세 가지 새로운 통계적 검정을 제안한다. 이 검정들은 유의수준 오류율을 잘 통제하고 높은 통계적 검정력(유의수준)을 보이며, 비대칭 연속형 결과에 대한 메타분석의 신뢰성을 향상시킨다.

ABSTRACT

For clinical studies with continuous outcomes, when the data are potentially skewed, researchers may choose to report the whole or part of the five-number summary (the sample median, the first and third quartiles, and the minimum and maximum values), rather than the sample mean and standard deviation. For the studies with skewed data, if we include them in the classical meta-analysis for normal data, it may yield misleading or even wrong conclusions. In this paper, we develop a flow chart and three new tests for detecting the skewness of data from the sample size and the five-number summary. Simulation studies demonstrate that our new tests are able to control the type I error rates, and meanwhile provide good statistical power. A real data example is also analyzed to demonstrate the usefulness of the skewness tests in meta-analysis and evidence-based practice.

연구 동기 및 목표

  • 평균과 표준편차 대신 오목수치 요약만 제공되는 임상 연구에서 비대칭성을 탐지하는 데 도전하는 것.
  • 기존의 정규분포 이론 기반 방법이 편향을 일으킬 수 있는 비대칭 데이터를 식별함으로써 메타분석의 타당성을 향상시키는 것.
  • 일반적인 정규분포 이론 기반 방법을 사용할 수 없을 때도 사용자 친화적이고 접근성이 높은 검정을 개발하여 임상의적 실천에 널리 활용될 수 있도록 하는 것.
  • 원자료나 완전한 서술 통계치에 접근할 수 없는 연구자들이 데이터 분포를 평가할 수 있도록 도구를 제공하는 것.

제안 방법

  • 저자는 정규분포 하에서 기대되는 순서통계량과 오목수치 요약 간의 관계를 바탕으로 세 가지 새로운 통계적 검정을 개발하였다.
  • 이 검정들은 표본 크기 기반으로 도출된 이론적 분위수와 관측된 오목수치 요약(중위수, Q1, Q3, 최솟값, 최댓값)을 비교한다.
  • 각 검정은 요약 통계치의 다른 조합을 사용하여 대칭성에서의 편차를 평가하며, 중위수와 사분위수의 상대적 위치에 초점을 맞춘다.
  • 이 검정들은 비대칭성을 탐지하는 데 높은 통계적 검정력을 유지하면서도 제1종 오류율을 잘 통제하도록 설계되었다.
  • 가용한 요약 통계치에 따라 가장 적절한 검정을 선택할 수 있도록 도와주는 흐름도를 제안하였다.
  • 시뮬레이션 연구를 통해 다양한 표본 크기와 비대칭 수준에서 검정의 성능을 검증하였다.

실험 결과

연구 질문

  • RQ1표본 크기와 오목수치 요약만을 사용하여 연속형 데이터의 비대칭성을 신뢰성 있게 탐지할 수 있는가?
  • RQ2제안된 검정들은 기존 방법과 비교해 보았을 때 제1종 오류 통제 및 통계적 검정력 측면에서 어떻게 다른가?
  • RQ3다양한 오목수치 요약의 부분 집합이 가용할 경우 최적의 검정 선택 전략은 무엇인가?
  • RQ4이 검정들은 다양한 표본 크기와 비대칭 수준에서 얼마나 잘 작동하는가?
  • RQ5이 검정들은 비대칭 임상 데이터를 포함하는 메타분석의 정확도를 향상시킬 수 있는가?

주요 결과

  • 제안된 검정들은 다양한 표본 크기와 분포 형태에서 제1종 오류율을 효과적으로 통제한다.
  • 이 검정들은 좌측 비대칭 및 우측 비대칭 분포를 탐지하는 데 높은 통계적 검정력을 보였다.
  • 시뮬레이션 결과, 이 검정들이 작은 표본부터 중간 크기의 표본까지에서도 강건한 성능을 유지함을 확인하였다.
  • 가용한 데이터에 따라 가장 적절한 검정을 선택할 수 있도록 도와주는 흐름도는 사용성에 크게 기여하였다.
  • 실제 데이터 예시를 통해 이러한 검정들을 적용하면 정규분포 이론 기반 방법으로는 풀 수 없는 비대칭 연구를 식별함으로써 더 정확한 메타분석 결론을 이끌어낼 수 있음을 보여주었다.
  • 이 검정들은 증거 기반 의학과 체계적 리뷰에 실용적이고 효과적인 도구로 입증되었다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.