QUICK REVIEW

[论文解读] Bayesian Inference of Individualized Treatment Effects using Multi-task Gaussian Processes

Ahmed M. Alaa, Mihaela van der Schaar|arXiv (Cornell University)|Apr 10, 2017

Gaussian Processes and Bayesian Inference参考文献 32被引用 90

一句话总结

提出一种贝叶斯多任务高斯过程框架，从观测数据中推断个体化治疗效果，带不确定性量化与基于风险的经验贝叶斯以减轻选择偏差；在 IHDP 和 UNOS 数据集上展示出相对于基线的 PEHE 性能提升。

ABSTRACT

Predicated on the increasing abundance of electronic health records, we investi- gate the problem of inferring individualized treatment effects using observational data. Stemming from the potential outcomes model, we propose a novel multi- task learning framework in which factual and counterfactual outcomes are mod- eled as the outputs of a function in a vector-valued reproducing kernel Hilbert space (vvRKHS). We develop a nonparametric Bayesian method for learning the treatment effects using a multi-task Gaussian process (GP) with a linear coregion- alization kernel as a prior over the vvRKHS. The Bayesian approach allows us to compute individualized measures of confidence in our estimates via pointwise credible intervals, which are crucial for realizing the full potential of precision medicine. The impact of selection bias is alleviated via a risk-based empirical Bayes method for adapting the multi-task GP prior, which jointly minimizes the empirical error in factual outcomes and the uncertainty in (unobserved) counter- factual outcomes. We conduct experiments on observational datasets for an inter- ventional social program applied to premature infants, and a left ventricular assist device applied to cardiac patients wait-listed for a heart transplant. In both experi- ments, we show that our method significantly outperforms the state-of-the-art.

研究动机与目标

动机：从观测数据中估计个体化治疗效果（ITE），并解决电子健康记录（EHR）中的选择偏差。
将潜在结果建模为向量值函数，并将ITE估计表述为 vvRKHS 中的多任务学习问题。
开发带线性共核的 CMGP，使其能够捕捉处理组与对照组结果之间的共性结构与任务特定结构。
引入基于风险的经验贝叶斯，通过在拟合真实结果误差与反事实不确定性之间取得平衡来调整核超参数。
提供ITE的贝叶斯可信区间，并在半合成的 IHDP 及真实 UNOS 数据集上与多种基线进行比较评估。

提出的方法

将 Y(i)(w) = f_w(X_i) + ε_i,w（高斯噪声）形式化，以将ITE与向量值函数 f = [f_0, f_1] 联系起来。
将 f 建模为具有向量值核 K_theta 的高斯过程，并使用线性共内核模型以使 f_0 和 f_1 具有不同的协方差（K_theta = A_0 k_0 + A_1 k_1）。
表示 ITE T(x) = e^T f(x)，其中 e = [-1, 1]^T，推导出表示定理，表明 T 位于核评估的线性包中；并与贝叶斯 GP 后验均值相连接。
引入贝叶斯 PEHE 风险及基于风险的经验贝叶斯，通过最小化经验事实误差与后验反事实不确定性之和来选择核超参数。
描述带有 ADAM 风格的超参数优化、后验 ITE 的计算以及 T(x) 的置信区间的 CMGP 算法。
可选：提及使用带贝叶斯正则化的留一交叉验证以稳定超参数选择。

实验结果

研究问题

RQ1我们是否可以利用潜在结果的多任务高斯过程先验从观测数据中准确估计个体化治疗效果？
RQ2如何量化并传播对比事实中的不确定性，以在不进行明确倾向评分建模的情况下产生可信的ITE区间？
RQ3与标准 GP 或单任务方法相比，基于风险的经验贝叶斯核超参数是否提升了对选择偏差的鲁棒性？
RQ4在半合成 IHDP 与真实世界 UNOS 数据集上，所提出的 CMGP 相对于前沿基线在 PEHE 方面的比较如何？
RQ5在将 CMGP 应用于临床等待名单情景中的异质性治疗效应时，会对精准医疗带来哪些实际洞见？

主要发现

Benchmark	IHDP In-sample PEHE	IHDP Out-of-sample PEHE	UNOS In-sample PEHE	UNOS Out-of-sample PEHE
CMGP	0.9 ± 0.07	1.0 ± 0.08	1.7 ± 0.10	1.8 ± 0.13
GP	2.1 ± 0.11	2.3 ± 0.14	4.1 ± 0.15	4.5 ± 0.20
BART	2.0 ± 0.13	2.2 ± 0.17	3.5 ± 0.17	3.9 ± 0.23
CF	2.3 ± 0.21	2.4 ± 0.23	3.8 ± 0.25	4.3 ± 0.31
VTRF	2.5 ± 0.26	2.9 ± 0.51	4.5 ± 0.35	4.9 ± 0.41
CFRF	2.7 ± 0.31	3.3 ± 0.72	4.7 ± 0.21	5.2 ± 0.32
BLR	5.9 ± 0.31	6.1 ± 0.41	5.7 ± 0.21	6.2 ± 0.30
BNN	2.1 ± 0.11	2.2 ± 0.13	3.2 ± 0.10	3.3 ± 0.12
CFRW	1.0 ± 0.07	1.2 ± 0.08	2.7 ± 0.07	2.9 ± 0.11
kNN	3.2 ± 0.12	4.2 ± 0.22	5.2 ± 0.11	5.4 ± 0.12
MS	2.8 ± 0.18	2.9 ± 0.20	4.6 ± 0.12	4.8 ± 0.16
TML	4.9 ± 0.23	4.9 ± 0.23	6.2 ± 0.31	6.2 ± 0.31

CMGPs 在 IHDP 与 UNOS 的样本内及样本外 PEHE 上均优于包括 GP、BART、CF、CFRF、Balancing regressors、kNN、MS、TML 等在内的广泛基线。
基于风险的经验贝叶斯超参数选择通过在拟合真实结果的同时对冲对照事实的不确定性，减少了选择偏差。
线性共核内核使模型能够捕捉 f0 与 f1 之间的不同异质性和相关特征，优于忽略 W–X 交互的方法。
产生了ITE的可信区间，便于对治疗决策进行个体化的置信度评估。
该方法在 UNOS LVAD 等待名单情境中展示了实际临床应用潜力，通过考虑个体风险可改善分配决策。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。