[论文解读] Scalable, Axiomatic Explanations of Deep Alzheimer's Diagnosis from Heterogeneous Data
本文提出SVEHNN,一种可扩展且符合公理的解释方法,用于阿尔茨海默病诊断中深度神经网络的预测,基于异质性数据——3D神经解剖点云和表格生物标志物。通过将训练好的DNN转换为轻量级概率神经网络,SVEHNN以二次方复杂度高效近似Shapley值,实现忠实且符合公理的解释,揭示了临床有意义的特征贡献,包括海马体形状以及p-tau和APOE4等生物标志物。
Deep Neural Networks (DNNs) have an enormous potential to learn from complex biomedical data. In particular, DNNs have been used to seamlessly fuse heterogeneous information from neuroanatomy, genetics, biomarkers, and neuropsychological tests for highly accurate Alzheimer's disease diagnosis. On the other hand, their black-box nature is still a barrier for the adoption of such a system in the clinic, where interpretability is absolutely essential. We propose Shapley Value Explanation of Heterogeneous Neural Networks (SVEHNN) for explaining the Alzheimer's diagnosis made by a DNN from the 3D point cloud of the neuroanatomy and tabular biomarkers. Our explanations are based on the Shapley value, which is the unique method that satisfies all fundamental axioms for local explanations previously established in the literature. Thus, SVEHNN has many desirable characteristics that previous work on interpretability for medical decision making is lacking. To avoid the exponential time complexity of the Shapley value, we propose to transform a given DNN into a Lightweight Probabilistic Deep Network without re-training, thus achieving a complexity only quadratic in the number of features. In our experiments on synthetic and real data, we show that we can closely approximate the exact Shapley value with a dramatically reduced runtime and can reveal the hidden knowledge the network has learned from the data.
研究动机与目标
- 为解决深度神经网络在阿尔茨海默病诊断中临床应用的障碍,提供忠实且可解释的解释。
- 开发一种满足局部解释所有基本公理的方法,确保理论上的稳健性。
- 实现在无需重新训练的情况下,对异质性输入(3D神经解剖形态与表格生物标志物)进行高效解释。
- 以与阿尔茨海默病临床认知一致的方式揭示深度网络所学习的隐藏知识。
- 克服高维生物医学数据中精确Shapley值计算的指数级计算成本。
提出的方法
- SVEHNN以Shapley值作为局部解释的理论基础,确保满足全部七个关键公理:完备性、零玩家、对称性、线性性、连续性、单调性与尺度不变性。
- 通过逐层转换,将预训练的深度神经网络转化为轻量级概率深度网络,无需重新训练即可保持模型行为。
- 该转换使SVEHNN能够使用蒙特卡洛采样以特征数量的二次方复杂度高效近似Shapley值,替代指数级计算。
- 该方法通过引入概率层来近似特征贡献,通过建模激活不确定性,实现快速且准确的解释推断。
- 采用凸包基线实现稳定近似,并在合成数据(用于误差分析)和ADNI的真实临床数据上评估解释效果。
- 解释结果按患者进行可视化,展示特征重要性评分及脑部结构(如海马体CA1亚区)的空间重要性图。
实验结果
研究问题
- RQ1能否对结合3D神经解剖形态与表格生物标志物的异质性深度神经网络高效近似Shapley值?
- RQ2所提出的SVEHNN方法是否在实现计算可行性的同时,仍保持Shapley值的理论保证?
- RQ3SVEHNN能否揭示阿尔茨海默病诊断中的临床有意义模式,如p-tau、APOE4及海马体萎缩在CA1中的作用?
- RQ4在保真度与运行时间方面,SVEHNN的近似质量与精确Shapley值及其他基线方法相比如何?
- RQ5SVEHNN的解释在多大程度上与阿尔茨海默病生物标志物的既定临床知识相一致?
主要发现
- 在阿尔茨海默病神经影像计划(ADNI)测试集上,SVEHNN实现了0.942的平衡准确率,表现出强大的预测性能。
- 在合成数据上,SVEHNN的近似误差较低,均方误差(MSE)为0.008,归一化折扣累计增益(NDCG)为0.986,表明其对精确Shapley值具有高保真度。
- 该方法将计算成本从指数级降低至二次方复杂度,使实际生物医学数据的部署成为可能。
- 解释结果表明,在部分患者中,海马体形状对诊断具有高度相关性,而在其他患者中,p-tau和APOE4等表格生物标志物则占主导地位。
- 空间归因图识别出海马体的CA1亚区是阿尔茨海默病诊断的关键区域,与临床文献一致。
- 该方法成功解释了个别患者预测,例如一名阿尔茨海默病患者中,海马体形状和p-tau为前两位贡献因素,验证了临床合理性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。