[논문 리뷰] Optimally estimating the sample mean and standard deviation from the five-number summary
이 논문은 중앙값, 사분위수, 최솟값, 최댓값으로 구성된 다섯 숫자 요약을 사용하여 표본 표준편차를 매끄럽게 가중치를 적용한 추정기로 제안하며, 표본 크기 정보를 활용하여 정확도를 향상시킵니다. 최적의 가중치를 위한 근사 공식과 간편 추정기 공식을 도입하여 정규분포 및 비정규분포 데이터 모두에서 기존 방법보다 뛰어난 성능을 보이며, 메타분석 적용을 위한 실용적인 도구(엑셀 및 온라인 계산기)를 제공합니다.
When reporting the results of clinical studies, some researchers may choose the five-number summary (including the sample median, the first and third quartiles, and the minimum and maximum values) rather than the sample mean and standard deviation, particularly for skewed data. For these studies, when included in a meta-analysis, it is often desired to convert the five-number summary back to the sample mean and standard deviation. For this purpose, several methods have been proposed in the recent literature and they are increasingly used nowadays. In this paper, we propose to further advance the literature by developing a smoothly weighted estimator for the sample standard deviation that fully utilizes the sample size information. For ease of implementation, we also derive an approximation formula for the optimal weight, as well as a shortcut formula for the sample standard deviation. Numerical results show that our new estimator provides a more accurate estimate for normal data and also performs favorably for non-normal data. Together with the optimal sample mean estimator in Luo et al., our new methods have dramatically improved the existing methods for data transformation, and they are capable to serve as rules of thumb in meta-analysis for studies reported with the five-number summary. Finally for practical use, an Excel spreadsheet and an online calculator are also provided for implementing our optimal estimators.
연구 동기 및 목표
- 임상 연구에서 데이터가 비대칭일 경우 다섯 숫자 요약에서 표본 평균과 표준편차를 추정하는 데 도전하는 문제를 해결하기 위해.
- 기존 추정 방법을 향상시키기 위해 표본 크기 정보를 표준편차 추정에 더 효과적으로 통합하기 위해.
- 다섯 숫자 요약과 표본 크기 정보 사이의 정보를 최적의 균형으로 조합할 수 있는 매끄러운 가중치 추정기를 개발하기 위해.
- 메타분석에 적용하기 위해 실용적이고 사용자 친화적인 도구(엑셀 스프레드시트 및 온라인 계산기)를 제공하기 위해.
- 다섯 숫자 요약을 사용하여 사용 가능한 평균과 표준편차 추정치로 변환하기 위한 강력한 규칙의 수칙을 설정하기 위해.
제안 방법
- 다섯 숫자 요약과 표본 크기 정보를 통합하는 표본 표준편차에 대한 매끄러운 가중치 추정기를 제안합니다.
- 사분이형범위와 표본 크기 사이의 균형을 이루기 위한 최적의 가중치에 대한 근사 공식을 유도하여 추정 정확도를 향상시킵니다.
- 복잡한 계산 없이도 정밀도를 잃지 않은 채 구현을 단순화하는 표본 표준편차를 위한 간편 공식을 도입합니다.
- 수치 시뮬레이션을 통해 정규분포 및 비정규분포를 포함한 다양한 분포에서 추정기의 성능을 검증합니다.
- Luo 등이 제안한 최적의 평균 추정기와 제안된 표준편차 추정기를 조합하여 완전한 변환 프레임워크를 구축합니다.
- 실시간 메타분석 환경에서 제안된 추정기를 적용할 수 있도록 엑셀 스프레드시트와 온라인 계산기를 제공합니다.
실험 결과
연구 질문
- RQ1표본 크기 정보를 활용하면서 다섯 숫자 요약에서 표본 표준편차를 최적으로 추정하는 방법은 무엇인가요?
- RQ2다양한 분포에서 표준편차 추정의 정확도를 극대화하기 위한 가중치 배분 방식은 무엇인가요?
- RQ3제안된 방법은 정규분포 및 비정규분포 데이터에서 기존 방법과 비교해 평균제곱오차 측면에서 어떻게 성능을 발휘합니까?
- RQ4제안된 추정기는 다섯 숫자 요약만 보고하는 연구에서 메타분석에 신뢰할 수 있는 규칙의 수칙으로 사용될 수 있나요?
- RQ5임상 및 역학 연구에서 새로운 추정 방법의 광범위한 도입을 지원하기 위해 어떤 실용적인 도구를 개발할 수 있을까요?
주요 결과
- 제안된 표준편차에 대한 매끄러운 가중치 추정기는 정규분포 데이터에서 기존 방법보다 유의미하게 더 정확한 추정치를 제공합니다.
- 이 방법은 비정규분포에 대해서도 강력한 성능을 유지하여 정규성 가정을 초월한 강인성을 입증합니다.
- 최적의 가중치에 대한 근사 공식은 복잡한 계산 없이도 효율적이고 정확한 구현을 가능하게 합니다.
- 표준편차를 위한 간편 공식은 실용적인 메타분석 적용에서 신속한 추정을 가능하게 합니다.
- 수치 결과는 Luo 등이 제안한 최적의 평균 추정기와 제안된 표준편차 추정기를 함께 사용할 경우 전체 변환 정확도가 크게 향상됨을 확인합니다.
- 엑셀 스프레드시트와 온라인 계산기의 가용성은 실제 메타분석 워크플로우에서 방법의 사용성과 보급성을 향상시킵니다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.