[論文レビュー] AutoPrognosis: Automated Clinical Prognostic Modeling via Bayesian Optimization with Structured Kernel Learning
AutoPrognosisは、 batched Bayesian optimization を用いた構造化カーネル学習分解に基づく臨床データの予後機械学習パイプライン設計を自動化し、多様な循環器系コホートに跨るアンサンブルと解釈可能な予測を実現します。
Clinical prognostic models derived from largescale healthcare data can inform critical diagnostic and therapeutic decisions. To enable off-theshelf usage of machine learning (ML) in prognostic research, we developed AUTOPROGNOSIS: a system for automating the design of predictive modeling pipelines tailored for clinical prognosis. AUTOPROGNOSIS optimizes ensembles of pipeline configurations efficiently using a novel batched Bayesian optimization (BO) algorithm that learns a low-dimensional decomposition of the pipelines high-dimensional hyperparameter space in concurrence with the BO procedure. This is achieved by modeling the pipelines performances as a black-box function with a Gaussian process prior, and modeling the similarities between the pipelines baseline algorithms via a sparse additive kernel with a Dirichlet prior. Meta-learning is used to warmstart BO with external data from similar patient cohorts by calibrating the priors using an algorithm that mimics the empirical Bayes method. The system automatically explains its predictions by presenting the clinicians with logical association rules that link patients features to predicted risk strata. We demonstrate the utility of AUTOPROGNOSIS using 10 major patient cohorts representing various aspects of cardiovascular patient care.
研究の動機と目的
- 臨床データの欠測補完、前処理、予測、キャリブレーションを含む予後MLパイプラインの設計を自動化する。
- 高次元パイプライン空間で効率的な GP ベースのベイズ最適化を可能にする、低次元の構造化カーネル分解を学習して。
- 外部コホートから BO をウォームスタートさせるためのメタ学習を組み込み、臨床医に解釈可能なルールベースの説明を提供する。
提案手法
- 欠測補完、特徴量処理、予測、キャリブレーションの4段階パイプラインとしてパイプライン構成をモデル化し、4,800 通りのパイプラインを対象とする。
- 黒箱関数としてパイプライン性能を最適化するため、バッチ Gaussian process ベースの Bayesian optimization を使用する。
- アルゴリズム間の相関を捉えるため、スパース加法カーネル分解を学習し、サブスペース割り当てに Dirichlet 事前分布を、更新には Gibbs サンプリングを用いる。
- 外部コホートとコホートのメタ特徴を用いた経験ベイズのメタ学習により BO をウォームスタートさせ、GP prior を適切にキャリブレーションする。
- 評価済みパイプラインからエンサンブルを構築するための事後ベイズモデル平均化。
- 特徴とリスク階層を結ぶベイズ連想規則を出力する解釈モジュールを提供する。
- 臨床スコアと AutoML ベースラインと比較して、10 の循環器コホートで評価する。
実験結果
リサーチクエスチョン
- RQ1構造化された加法カーネルを持つ GP prior は臨床予後モデリングにおける高次元 AutoML パイプライン空間でスケーラブルなベイズ最適化を可能にするか。
- RQ2AutoPrognosis は多様な患者コホートにおいて、標準的な臨床リスクスコアおよび既存のAutoMLフレームワークより予後性能を向上させるか。
- RQ3類似患者の事前データを用いた経験ベイズによるメタ学習は、新規コホートの BO を効果的にウォームスタートできるか。
- RQ4エンサンブルおよび解釈器コンポーネントは堅牢な予測性能と臨床的に意味のある説明を提供するか。
主な発見
- AutoPrognosis は AUC-ROC 評価において、10 の循環器コホート全体で臨床リスクスコアおよび AutoML ベースラインを上回った。
- 学習されたカーネル分解は、パフォーマンスが類似するアルゴリズムをクラスタリングし、例として木ベースの欠測補完と予測法が同じサブスペースにグルーピングされた。
- 事後ベイズモデル平均化は探索された全パイプラインを活用し、少数サンプル設定での頑健性を向上させる。
- 経験ベイズ校正によるメタ学習は、新規コホートに対する BO の収束と事前情報量を改善する。
- 解釈モジュールは患者特徴とリスク階層を結ぶベイズ連想規則を生成し、臨床的に実用的な説明を可能にする。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。