Skip to main content
QUICK REVIEW

[論文レビュー] Bayesian Inference of Individualized Treatment Effects using Multi-task Gaussian Processes

Ahmed M. Alaa, Mihaela van der Schaar|arXiv (Cornell University)|Apr 10, 2017
Gaussian Processes and Bayesian Inference参考文献 32被引用数 90
ひとこと要約

ベイジアン多タスクガウス過程フレームワークを提案し、観察データから個別化治療効果(ITE)を推定する際の不確かさの定量化と選択バイアスを緩和するリスクベースの経験的ベイズを提供。IHDPおよびUNOSデータセットで、ベースラインよりPEHE性能が向上することを示した。

ABSTRACT

Predicated on the increasing abundance of electronic health records, we investi- gate the problem of inferring individualized treatment effects using observational data. Stemming from the potential outcomes model, we propose a novel multi- task learning framework in which factual and counterfactual outcomes are mod- eled as the outputs of a function in a vector-valued reproducing kernel Hilbert space (vvRKHS). We develop a nonparametric Bayesian method for learning the treatment effects using a multi-task Gaussian process (GP) with a linear coregion- alization kernel as a prior over the vvRKHS. The Bayesian approach allows us to compute individualized measures of confidence in our estimates via pointwise credible intervals, which are crucial for realizing the full potential of precision medicine. The impact of selection bias is alleviated via a risk-based empirical Bayes method for adapting the multi-task GP prior, which jointly minimizes the empirical error in factual outcomes and the uncertainty in (unobserved) counter- factual outcomes. We conduct experiments on observational datasets for an inter- ventional social program applied to premature infants, and a left ventricular assist device applied to cardiac patients wait-listed for a heart transplant. In both experi- ments, we show that our method significantly outperforms the state-of-the-art.

研究の動機と目的

  • 観察データから個別化治療効果(ITE)の推定を動機づけ、EHRにおける選択バイアスに対処する。
  • 潜在結果をベクトル値関数としてモデル化し、ITE推定をvvRKHSにおけるマルチタスク学習問題として位置づける。
  • 処置群と対照群の結果間の共有およびタスク特有の構造を捕らえるリニアコアレストレーション核を用いてCMGPsを開発する。
  • ファクト実データの誤差と反事実の不確かさのバランスを取るリスクベースの経験的ベイズを導入し、核ハイパーパラメータを適応させる。
  • 半合成IHDPおよびUNOSデータセットで、ITEのベイズ信頼区間を提供し、複数のベースラインと比較して評価する。

提案手法

  • ITEをベクトル値関数f=[f_0, f_1]として接続するためにY(i)(w) = f_w(X_i) + ε_i,wを仮定しガウスノイズを用いる。
  • fをベクトル値カーネルK_thetaを用いたガウス過程としてモデル化し、コアレジーベーションの線形モデルを用いてf_0とf_1が異なる共分散を持つことを許す(K_theta = A_0 k_0 + A_1 k_1)。
  • ITE T(x) = e^T f(x)をe=[-1, 1]^Tとして表現数定理を導出し、Tがカーネル評価のspanにあることを示し、ベイズGPの後方平均と結びつける。
  • ベイズPEHEリスクとリスクベースのベイズを導入して、経験的事実誤差と事後の反事実不確かさを最小化することで核ハイパーパラメータを選択する。
  • CMGPsのハイパーパラメータをADAMベースで最適化し、後方ITEとT(x)の信頼区間を計算するアルゴリズムを記述する。
  • 任意: ベイズ正則化を用いたLeave-One-Out交差検証によるハイパーパラメータ選択の安定化に言及。

実験結果

リサーチクエスチョン

  • RQ1観察データから潜在結果に対するマルチタスクGP事前分布を用いて個別化治療効果を正確に推定できるか?
  • RQ2 explicit propensity モデル化なしで反事実の不確かさをどのように推定・伝播し、ITE区間を信頼区間として提供できるか?
  • RQ3核ハイパーパラメータのリスクベースの経験的ベイズは、標準GPや単一タスク手法と比較して選択バイアスへのロバスト性を改善するか?
  • RQ4提案するCMGP手法は、半合成IHDPおよび実データUNOSデータセットに対してPEHEの点で最先端ベースラインと比較してどの程度優れているか?
  • RQ5臨床のウェイトリスト状況での異種治療効果にCMGPを適用する際、個別リスクを考慮することで精密医療にどんな実践的洞察が得られるか?

主な発見

BenchmarkIHDP In-sample PEHEIHDP Out-of-sample PEHEUNOS In-sample PEHEUNOS Out-of-sample PEHE
CMGP0.9 ± 0.071.0 ± 0.081.7 ± 0.101.8 ± 0.13
GP2.1 ± 0.112.3 ± 0.144.1 ± 0.154.5 ± 0.20
BART2.0 ± 0.132.2 ± 0.173.5 ± 0.173.9 ± 0.23
CF2.3 ± 0.212.4 ± 0.233.8 ± 0.254.3 ± 0.31
VTRF2.5 ± 0.262.9 ± 0.514.5 ± 0.354.9 ± 0.41
CFRF2.7 ± 0.313.3 ± 0.724.7 ± 0.215.2 ± 0.32
BLR5.9 ± 0.316.1 ± 0.415.7 ± 0.216.2 ± 0.30
BNN2.1 ± 0.112.2 ± 0.133.2 ± 0.103.3 ± 0.12
CFRW1.0 ± 0.071.2 ± 0.082.7 ± 0.072.9 ± 0.11
kNN3.2 ± 0.124.2 ± 0.225.2 ± 0.115.4 ± 0.12
MS2.8 ± 0.182.9 ± 0.204.6 ± 0.124.8 ± 0.16
TML4.9 ± 0.234.9 ± 0.236.2 ± 0.316.2 ± 0.31
  • CMGPはIHDPおよびUNOSのインサンプル・アウトオブサンプルPEHEの両方で、GP、BART、CF、CFRF、Balancing regressors、kNN、MS、TMLと比較して優れている。
  • リスクベースの経験的ベイズのハイパーパラメータ選択は、ファクトアウトカムを適合させつつ反事実不確実性を正則化することで選択バイアスを低減する。
  • リニアコアレストレーション核はf0とf1の異なる不均一性と関連特徴を捉えられ、W–X相互作用を無視する方法より優れている。
  • ITEの信頼区間を提供し、治療意思決定の個別的な信頼性を評価できる。
  • UNOS LVAD待機リストの文脈で臨床的実用性を示し、個人リスクを考慮した割り当て決定の改善可能性を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。