QUICK REVIEW

[논문 리뷰] Identifying Treatment Effects using Trimmed Means when Data are Missing Not at Random

Alex Ocampo, Heinz Schmidli|arXiv (Cornell University)|2019. 08. 02.

Statistical Methods in Clinical Trials참고 문헌 31인용 수 4

한 줄 요약

이 논문은 데이터가 비랜덤으로 누락된 경우(특히 악화된 결과로 인한 이탈이 있을 경우) 임상 시험에서 치료 효과를 추정하기 위한 트림드 미디안 방법을 제안한다. 이 방법은 각 치료군의 분포에서 가장 낮은 비율을 잘라내기 전에 누락된 값을 관찰된 가장 나쁜 결과로 할당함으로써 강한 MNAR 및 위치 이동 가정 하에서 평균 치료 효과를 일관되게 추정한다. 시뮬레이션 결과, MNAR 조건에서는 강건한 성능을 보이며, MAR 조건에서는 실패함을 확인하였다.

ABSTRACT

Patients often discontinue treatment in a clinical trial because their health condition is not improving. Consequently, the patients still in the study at the end of the trial have better health outcomes on average than the initial patient population would have had if every patient had completed the trial. If we only analyze the patients who complete the trial, then this missing data problem biases the estimator of a medication's efficacy because study outcomes are missing not at random (MNAR). One way to overcome this problem - the trimmed means approach for missing data - sets missing values as slightly worse than the worst observed outcome and then trims away a fraction of the distribution from each treatment arm before calculating differences in treatment efficacy (Permutt 2017, Pharmaceutical statistics 16.1:20-28). In this paper we derive sufficient and necessary conditions for when this approach can identify the average population treatment effect in the presence of MNAR data. Numerical studies show the trimmed means approach's ability to effectively estimate treatment efficacy when data are MNAR and missingness is strongly associated with an unfavorable outcome, but trimmed means fail when data are missing at random (MAR) when the better approach would be to multiply impute the missing values. If the reasons for discontinuation in a clinical trial are known analysts can improve estimates with a combination of multiple imputation (MI) and the trimmed means approach when the assumptions of each missing data mechanism hold. When the assumptions are justifiable, using trimmed means can help identify treatment effects notwithstanding MNAR data.

연구 동기 및 목표

데이터가 비랜덤으로 누락된 경우(즉, MNAR일 경우) 트림드 미디안 방법이 치료 효과를 일관되게 추정할 수 있는 조건을 규명하는 것.
시뮬레이션 연구를 통해 다양한 MNAR 및 MAR 메커니즘 하에서 트림드 미디안의 성능을 평가하는 것.
두 방법의 가정이 모두 충족될 경우 다중 보정과 트림드 미디안을 조합한 하이브리드 방법을 제안하는 것.
특히 유효성 부족으로 인한 높은 이탈률이 있는 만성 통증 시험에서 실제 임상 시험 데이터에 이 방법의 유용성을 입증하는 것.
정확한 추론을 위해 임상적 판단을 통해 MNAR와 MAR 이탈을 구분하는 중요성을 부각하는 것.

제안 방법

트림드 미디안 방법은 각 치료군의 분포에서 가장 낮은 꼬리 부분을 사전에 지정된 비율(α)만큼 잘라내기 전에 누락된 결과값을 각 치료군 내에서 관찰된 가장 나쁜 값으로 할당한다.
이 방법은 치료군 간 트림드 미디안의 차이로 치료 효과를 추정하며, 결과적으로 성과가 가장 양호한 환자 집단만 분석하는 방식이다.
이 방법은 두 가지 핵심 가정에 의존한다: 강한 MNAR(모든 누락된 값이 트림 퀀틸 이하보다 나쁘다) 및 위치 이동(미트림된 분포들이 서로 이동된 형태이다).
이 방법은 공분산 분석(ANCOVA)을 통해 공변량을 포함하고, 반복 측정에 대한 혼합 모델(MMRM)에 적용된다.
하나의 조합 방법을 제안한다: MAR 이탈에는 다중 보정을, MNAR 이탈에는 트림드 미디안을 사용하며, MNAR 이탈이 MAR 이탈 이전에 발생한다고 가정한다.
감도 분석을 권장하며, 관측된 데이터에서 위치 이동 가정의 타당성을 평가하기 위해 콜모고로프-스미르노프 검정을 사용한다.

실험 결과

연구 질문

RQ1데이터가 MNAR일 경우 트림드 미디안 방법이 평균 치료 효과를 일관되게 추정할 수 있는 조건은 무엇인가?
RQ2MNAR와 MAR의 누락 메커니즘 하에서 트림드 미디안의 성능은 기존 방법과 비교해 어떻게 다를까?
RQ3다중 보정과 트림드 미디안을 조합하면 두 방법의 가정이 모두 충족될 경우 추정 성능이 향상되는가?
RQ4강한 MNAR 가정에서의 위반에 대해 트림드 미디안 추정기는 얼마나 강건한가?
RQ5MNAR 데이터 존재 하에서 트림의 영향은 편향, 분산 및 검정력에 어떤 영향을 미치는가?

주요 결과

강한 MNAR 및 위치 이동 가정 하에서 트림드 미디안 방법은 일관된 치료 효과 추정을 제공하며, 시뮬레이션 결과 낮은 편향과 양호한 신뢰구간 커버리지가 확인되었다.
악화된 결과로 인한 이탈이 있는 MNAR 시나리오에서는 강한 MNAR 가정이 약간 위반되더라도 이 방법이 잘 작동함을 확인하였다.
MAR 메커니즘 하에서는 트림드 미디안이 심각한 편향을 유발하여, 누락 메커니즘을 정확히 식별할 필요성을 강조한다.
MAR 이탈에는 다중 보정, MNAR 이탈에는 트림드 미디안을 적용하는 조합 방법은 추정 정확도를 유지하고, 전반적인 트림드 미디안 적용보다 표준 오차를 감소시켰다.
만성 통증 임상 시험 사례에서, 조합 방법은 전체 분석과 유사한 치료 추정치를 유지했지만, 트림드 미디안 단독 적용보다 더 낮은 표준 오차를 기록하였다.
편향-분산 트레이드오프는 강한 MNAR 가정이 타당할 경우 더 높은 트림을 선호하게 하며, 이는 트림이 가정의 타당성을 증가시키기 때문이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.