[论文解读] Fairly Predicting Graft Failure in Liver Transplant for Organ Assigning
本文提出一个公平的机器学习框架,结合基于嵌入的稀疏特征处理与树-distilled 密集特征,以预测 liver graft failure,使用两步去偏策略改善器官分配中的种族与性别公平性。
Liver transplant is an essential therapy performed for severe liver diseases. The fact of scarce liver resources makes the organ assigning crucial. Model for End-stage Liver Disease (MELD) score is a widely adopted criterion when making organ distribution decisions. However, it ignores post-transplant outcomes and organ/donor features. These limitations motivate the emergence of machine learning (ML) models. Unfortunately, ML models could be unfair and trigger bias against certain groups of people. To tackle this problem, this work proposes a fair machine learning framework targeting graft failure prediction in liver transplant. Specifically, knowledge distillation is employed to handle dense and sparse features by combining the advantages of tree models and neural networks. A two-step debiasing method is tailored for this framework to enhance fairness. Experiments are conducted to analyze unfairness issues in existing models and demonstrate the superiority of our method in both prediction and fairness performance.
研究动机与目标
- 通过解决 MELD 在术后结果与供体/器官特征方面的局限性来推动公平的器官分配。
- 开发一个统一框架,处理用于移植失败预测的密集与稀疏特征。
- 在预测过程中加入公平性约束,减少种族与性别群体之间的偏见。
- 在 STAR 肝移植数据集上评估该方法,并与传统基线方法进行对比。
提出的方法
- 使用 CatNN 处理稀疏特征(嵌入 + FM 交互)以捕捉一阶/二阶及更高阶的交互。
- 通过将树模型中的知识蒸馏为神经网络来处理密集特征,使网络模仿树的聚类(叶子)结构。
- 通过权重组合在 sigmoid 输出之前进行端到端的稀疏和密集表示融合。
- 使用交叉熵损失进行训练,并应用两步公平性正则化以使预测在敏感群体之间对齐(人口统计平等)。
- 两步去偏:(1)在密集特征蒸馏损失中加入公平性损失;(2)在端到端训练损失中加入公平性损失。
实验结果
研究问题
- RQ1MELD 是否与器官接收率及术后移植物失败在不同种族和性别群体之间对齐?
- RQ2所提出的公平 ML 框架是否能够在减少子群偏见的同时实现准确的移植失败预测?
- RQ3每个去偏阶段对最终预测公平性的贡献是什么?
- RQ4在准确性和公平性指标上,该框架与基线 MELD、逻辑回归、随机森林和梯度提升模型相比如何?
主要发现
| 模型 | 敏感属性:种族 | 敏感属性:性别 | ROC AUC(种族) | DPD(种族) | EOD(种族) | ROC AUC(性别) | DPD(性别) | EOD(性别) |
|---|---|---|---|---|---|---|---|---|
| MELD-score | — | — | 0.505 ± 0.000 | — | — | 0.505 ± 0.000 | — | |
| Logistic Regression | 0.777 ± 0.000 | 0.648 ± 0.017 | 0.834 ± 0.007 | 0.777 ± 0.000 | 0.021 ± 0.000 | 0.033 ± 0.001 | ||
| Random forest | 0.804 ± 0.000 | 0.630 ± 0.030 | 0.703 ± 0.047 | 0.804 ± 0.000 | 0.020 ± 0.001 | 0.036 ± 0.001 | ||
| GBDT | 0.809 ± 0.000 | 0.637 ± 0.027 | 0.713 ± 0.033 | 0.809 ± 0.000 | 0.017 ± 0.000 | 0.031 ± 0.001 | ||
| W/o first-step | 0.793 ± 0.000 | 0.596 ± 0.022 | 0.687 ± 0.038 | 0.792 ± 0.000 | 0.016 ± 0.002 | 0.027 ± 0.002 | ||
| W/o second-step | 0.793 ± 0.001 | 0.616 ± 0.041 | 0.745 ± 0.076 | 0.793 ± 0.001 | 0.014 ± 0.007 | 0.026 ± 0.009 | ||
| Ours | 0.792 ± 0.000 | 0.597 ± 0.015 | 0.662 ± 0.029 | 0.793 ± 0.001 | 0.011 ± 0.001 | 0.022 ± 0.003 |
- 所提出的框架在相对于基线的预测性能具有竞争力,同时减少子群偏见。
- MELD-分数 alone 与移植失败的相关性较弱,对各子群的公平性对齐也不好。
- 两步去偏在公平性指标(人口统计学差异和等化机会差异)方面超越基线模型。
- 消融研究显示结合两步去偏可以获得最佳的公平性结果。
- 基于种族的预测在去偏后受益显著,ROC-AUC 影响温和;基于性别的公平性在公平性指标上有明显提升,且 ROC-AUC 变化较小。
- 该方法在 STAR 数据集上对种族和性别群体显示出改善的公平性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。