QUICK REVIEW

[논문 리뷰] Mixture Model Framework for Traumatic Brain Injury Prognosis Using Heterogeneous Clinical and Outcome Data

Alan D. Kaplan, Qi Cheng|arXiv (Cornell University)|2020. 12. 22.

Trauma and Emergency Care Studies참고 문헌 43인용 수 4

한 줄 요약

이 논문은 외상성 뇌손상(TBI)의 예후를 향상시키기 위해 이질적인 임상, 생물표지자, 영상 및 결과 데이터를 결합하여 결측치가 있는 경우에도 모델링할 수 있는 생성적 혼합 모델 프레임워크를 제안한다. TRACK-TBI 피лот 데이터셋을 사용하여 모델은 고유한 환자 하위군을 식별하고, 기준선을 초월해 결과의 불확실성을 감소시키며, 새로운 환자에 대한 가능도 기반 위험 점수를 제공함으로써 TBI에서 정밀의료의 정밀도를 향상시킨다.

ABSTRACT

Prognoses of Traumatic Brain Injury (TBI) outcomes are neither easily nor accurately determined from clinical indicators. This is due in part to the heterogeneity of damage inflicted to the brain, ultimately resulting in diverse and complex outcomes. Using a data-driven approach on many distinct data elements may be necessary to describe this large set of outcomes and thereby robustly depict the nuanced differences among TBI patients' recovery. In this work, we develop a method for modeling large heterogeneous data types relevant to TBI. Our approach is geared toward the probabilistic representation of mixed continuous and discrete variables with missing values. The model is trained on a dataset encompassing a variety of data types, including demographics, blood-based biomarkers, and imaging findings. In addition, it includes a set of clinical outcome assessments at 3, 6, and 12 months post-injury. The model is used to stratify patients into distinct groups in an unsupervised learning setting. We use the model to infer outcomes using input data, and show that the collection of input data reduces uncertainty of outcomes over a baseline approach. In addition, we quantify the performance of a likelihood scoring technique that can be used to self-evaluate the extrapolation risk of prognosis on unseen patients.

연구 동기 및 목표

인구통계, 생물표지자, 영상 및 종단점과 같은 다양한 이질적인 TBI 데이터 유형을 통합하여 단일 확률적 프레임워크를 개발하는 것.
TBI 데이터셋에서의 결측치 문제를 해결하기 위해 결측치를 명시적으로 모델링하여 훈련 중 모든 환자를 포함하는 것.
다중모odal 데이터의 잠재적 구조를 바탕으로 생물학적 및 임상적으로 의미 있는 하위군으로 비지도 환자 분류를 가능하게 하는 것.
모든 이용 가능한 데이터 요소를 동시에 활용하여 결과 예측의 불확실성을 감소시키는 것.
새로운 환자에 대한 예후 신뢰도를 평가하기 위해 가능도 기반 점수 방법을 제공하여 훈련된 모델 분포에 대한 데이터의 적합도를 측정하는 것.

제안 방법

잠재 변수를 통해 관측되지 않은 환자 하위군을 표현하는 유한한 가우시안 혼합 모델(GMM)을 사용하는 프레임워크.
연속형 및 이산형 변수를 함께 모델링하기 위해 결측치를 고려한 공동 확률 분포를 사용하며, 결측치는 근사화를 통해 처리된다.
결측치가 가능도 함수에 명시적으로 통합되어 데이터 삭제 없이 전체 가능도 추정이 가능해진다.
TRACK-TBI 피롤 데이터셋(n=586)에서 3개월, 6개월, 12개월 부상 후 다중모달 데이터를 사용하여 기대값 최대화(EM) 알고리즘을 통해 모델을 훈련한다.
결과 예측은 입력 데이터 조건부 확률 P(outcome | input data)를 사용한 조건부 추론을 통해 수행되며, 결과에 대한 전체 후행 분포를 활용한다.
새로운 환자의 입력 데이터가 훈련 분포와 일치하는지 평가하기 위해 가능도 점수 기법을 도입한다. 이는 예후의 신뢰도를 나타낸다.

실험 결과

연구 질문

RQ1결측치를 처리할 수 있는 단일 생성 모델이 인구통계, 생물표지자, 영상 및 임상 결과와 같은 이질적인 TBI 데이터 유형을 효과적으로 통합할 수 있는가?
RQ2다중모달 TBI 데이터의 공동 모델링을 통해 어떤 잠재적 환자 하위군이 도출되며, 이들은 임상적으로 해석 가능한가?
RQ3모든 데이터 수집을 활용할 경우 기준선 또는 우연의 경우에 비해 결과 예측의 불확실성이 얼마나 감소하는가?
RQ4특히 데이터가 훈련 집단과 일치하지 않을 수 있는 경우, 모델의 신뢰도는 어떻게 평가할 수 있는가?
RQ5모델의 가능도 점수는 임상 예후에서 외삽 위험의 대체 지표로 사용될 수 있는가?

주요 결과

모델은 외상 특징과 결과에서 임상적으로 의미 있는 차이를 보이는 세 가지 고유한 환자 하위군을 성공적으로 식별하여 환자 분류를 가능하게 하였다.
모든 이용 가능한 데이터 요소를 활용한 결과, 기준선 대비 결과 예측의 불확실성이 감소하여 더 높은 예후 정확도를 입증하였다.
훈련된 모델 하에서 입력 데이터의 가능도가 예측의 신뢰도와 상관이 있음을 입증하였으며, 낮은 가능도일수록 외삽 위험이 높음을 나타내었다.
점근적 절대 오차(EAE) 지표를 사용하여 결과 예측 성능을 향상시켰으며, 이는 점추정치가 아닌 전체 예측 분포를 고려하기 때문이다.
이 프레임워크는 다중 결과 변수에 동시에 추론을 수행할 수 있어 별도의 모델을 만들 필요가 없으며, 임의의 연관성 위험을 줄이는 데 기여한다.
결측치가 있는 경우에도 모델이 결측치를 명시적으로 모델링함으로써 모든 이용 가능한 데이터를 기반으로 강력한 추론이 가능하다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.