Skip to main content
QUICK REVIEW

[논문 리뷰] AutoPrognosis: Automated Clinical Prognostic Modeling via Bayesian Optimization with Structured Kernel Learning

Ahmed M. Alaa, Mihaela van der Schaar|arXiv (Cornell University)|2018. 02. 20.
Machine Learning and Data Classification참고 문헌 15인용 수 53
한 줄 요약

AutoPrognosis는 구조화된 커널 학습 분해를 통한 배치된 베이지안 최적화를 활용하여 임상 데이터에 대한 예후 ML 파이프라인 설계를 자동화하고, 다양한 심혈관 코호트에서 앙상블과 해석 가능한 예측을 가능하게 한다.

ABSTRACT

Clinical prognostic models derived from largescale healthcare data can inform critical diagnostic and therapeutic decisions. To enable off-theshelf usage of machine learning (ML) in prognostic research, we developed AUTOPROGNOSIS: a system for automating the design of predictive modeling pipelines tailored for clinical prognosis. AUTOPROGNOSIS optimizes ensembles of pipeline configurations efficiently using a novel batched Bayesian optimization (BO) algorithm that learns a low-dimensional decomposition of the pipelines high-dimensional hyperparameter space in concurrence with the BO procedure. This is achieved by modeling the pipelines performances as a black-box function with a Gaussian process prior, and modeling the similarities between the pipelines baseline algorithms via a sparse additive kernel with a Dirichlet prior. Meta-learning is used to warmstart BO with external data from similar patient cohorts by calibrating the priors using an algorithm that mimics the empirical Bayes method. The system automatically explains its predictions by presenting the clinicians with logical association rules that link patients features to predicted risk strata. We demonstrate the utility of AUTOPROGNOSIS using 10 major patient cohorts representing various aspects of cardiovascular patient care.

연구 동기 및 목표

  • 임상 데이터를 위한 보간(imputation), 전처리, 예측, 보정(calibration)을 포함하는 예후 ML 파이프라인 설계를 자동화합니다.
  • 고차원 파이프라인 공간에서 효율적인 GP 기반 베이지안 최적화를 가능하게 하기 위해 저차원 구조화 커널 분해를 학습합니다.
  • 외부 코호트에서 BO를 워밍스타트하기 위한 메타러닝을 도입하고 임상의에게 해석 가능한 규칙 기반 설명을 제공합니다.

제안 방법

  • 4단계 파이프라인(임퓨테이션, 피처 처리, 예측, 보정)으로 파이프라인 구성을 모델링하고, 4,800개의 가능한 파이프라인.
  • 배치된 Gaussian process 기반의 베이지안 최적화를 사용하여 파이프라인 성능을 블랙박스 함수로 최적화합니다.
  • 알고리즘 간 상관관계를 포착하기 위한 희소 가법 커널 분해를 학습하고, 부분공간 할당에 대한 Dirichlet 사전분포와 업데이트를 위한 Gibbs 샘플링을 사용합니다.
  • 외부 코호트와 코호트 메타 피처를 사용한 경험적 베이즈 메타러닝을 통해 BO를 워밍스타트하고 GP 사전분포를 보정합니다.
  • 평가된 파이프라인으로부터 앙상블을 구성하기 위한 사후 베이지안 모델 평균화.
  • 특징을 위험 계층과 연결하는 베이지안 연관 규칙을 출력하는 해석기 모듈을 제공합니다.
  • 10개의 심혈관 코호트를 대상으로 평가하고 임상 점수 및 AutoML 베이스라인과 비교합니다.

실험 결과

연구 질문

  • RQ1구조화된 가법 커널 GP 사전이 임상 예후 모델링에서 고차원 AutoML 파이프라인 공간에 대해 확장 가능한 베이지안 최적화를 가능하게 할 수 있는가?
  • RQ2AutoPrognosis가 다양한 환자 코호트에 걸쳐 표준 임상 위험 점수 및 기존 AutoML 프레임워크보다 예후 성능을 향상시키는가?
  • RQ3유사한 환자의 과거 데이터를 사용하여 경험적 베이즈를 통한 메타러닝이 새로운 코호트를 위한 BO를 효과적으로 워밍스타트할 수 있는가?
  • RQ4앙상블 및 해석기 구성요소가 견고한 예측 성능과 임상적으로 의미 있는 설명을 제공하는가?

주요 결과

  • AutoPrognosis는 AUC-ROC 평가에서 10개의 심혈관 코호트 전반에 걸쳐 임상 위험 점수 및 AutoML 베이스라인을 능가했습니다.
  • 학습된 커널 분해는 성능이 비슷한 알고리즘을 클러스터링했으며, 예를 들어 트리 기반 임퓨테이션 및 예측 방법이 동일한 부분공간으로 묶였습니다.
  • 사후 베이지안 모델 평균화는 탐색된 모든 파이프라인을 활용하여 작은 샘플 설정에서의 견고성을 향상시킵니다.
  • 메타러닝을 통한 경험적 베이즈 보정은 새로운 코호트에 대한 BO 수렴 및 사전 정보의 유효성을 향상시킵니다.
  • 해석기 모듈은 환자 특징을 위험 계층에 연결하는 베이지안 연관 규칙을 생성하여 임상적으로 실행 가능한 설명을 가능하게 합니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.