[论文解读] Site-Agnostic 3D Dose Distribution Prediction with Deep Learning Neural Networks
该论文提出了一种基于3D U-Net深度学习架构的、与部位无关的3D剂量预测模型,利用迁移学习实现跨治疗部位的泛化。通过在少量目标数据上微调在前列腺IMRT数据上预训练的模型,该方法在头颈部VMAT数据上实现了高精度——PTV的平均绝对剂量误差为1.08%,OAR的平均剂量误差为2.43%,即使在有限的部位特异性数据下也表现出色。
Typically, the current dose prediction models are limited to small amounts of data and require re-training for a specific site, often leading to suboptimal performance. We propose a site-agnostic, 3D dose distribution prediction model using deep learning that can leverage data from any treatment site, thus increasing the total data available to train the model. Applying our proposed model to a new target treatment site requires only a brief fine-tuning of the model to the new data and involves no modifications to the model input channels or its parameters. Thus, it can be efficiently adapted to a different treatment site, even with a small training dataset.
研究动机与目标
- 解决当前部位特异性剂量预测模型存在的局限性,即需要重新训练且在数据有限时表现不佳。
- 开发一种通用的、与部位无关的深度学习框架,用于3D剂量分布预测,可在极少再训练的情况下适配新治疗部位。
- 通过迁移学习利用来自多种治疗部位的数据,提升模型在新部位上的泛化能力和性能。
- 将临床DVH约束纳入模型输入,实现可调节的、与医生偏好对齐的交互式剂量预测。
- 证明在新部位上微调预训练模型的表现优于从零开始训练,尤其在小样本数据情况下。
提出的方法
- 采用3D U-Net架构作为3D剂量预测的主干神经网络,分别在前列腺IMRT数据(源域)和头颈部VMAT数据(目标域)上进行训练。
- 通过微调在源域数据(前列腺数据)上预训练的模型,将其适配到目标域数据,实现无需改变网络结构的迁移。
- 对比四种模型:源模型(在源数据上训练)、目标模型(在目标数据上从零开始训练)、适配模型(在目标数据上微调源模型)以及合并模型(在源与目标数据合并后训练)。
- 将患者特异性的DVH约束作为输入特征,以引导预测并实现目标覆盖与OAR保护之间的可调和权衡。
- 使用剂量体积直方图(DVH)指标——包括D98、D95、D02、平均剂量和最大剂量——作为PTV和OARs的定量评估标准。
- 采用均方误差(MSE)损失评估不同训练数据规模下的模型性能,分析在数据稀缺条件下的泛化能力。
实验结果
研究问题
- RQ1在不改变网络结构的前提下,基于一个治疗部位(前列腺IMRT)训练的深度学习模型能否有效泛化到另一个不同部位(头颈部VMAT)?
- RQ2在目标数据有限的情况下,微调预训练模型与从零开始训练相比,在预测精度上表现如何?
- RQ3尽管存在数据不平衡,将多个治疗部位的数据合并是否能提升模型在新目标部位上的性能?
- RQ4将DVH约束作为输入在多大程度上提升了模型的临床相关性与可调性?
- RQ5模型性能对训练数据规模的敏感程度如何,特别是在低数据量场景下?
主要发现
- 在前列腺IMRT数据上测试时,源模型在PTV上的平均绝对剂量误差为0.32%±0.14,最大误差为2.37%±0.93。
- 在头颈部VMAT目标部位上,适配模型在PTV上的平均绝对剂量误差为1.08%±0.95,最大误差为2.90%±1.35。
- 适配模型在目标部位上的表现优于目标模型(从零开始训练),尤其在小样本数据情况下,即使仅使用完整数据集的10%,其MSE损失也更低。
- 合并模型在源部位表现有所提升,但由于数据不平衡和模态差异,在目标部位表现较差。
- 在目标部位,适配模型在所有OAR上实现了平均OAR剂量误差2.43%和最大OAR剂量误差4.33%,表现出强大的泛化能力。
- 模型性能对训练数据规模高度敏感,适配模型在所有数据尺度下均表现出最稳定且最低的损失,表明其对数据稀缺具有强鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。