[论文解读] Regression-based Deep-Learning predicts molecular biomarkers from pathology slides
本论文提出一种基于回归的、自监督、基于注意力的弱监督深度学习方法,直接从病理图像预测连续的分子生物标志物,在11,671名患者和九种癌症类型的评估中表现良好。与分类相比,回归在 biomarker 预测的准确性和可解释性方面有提升,在结直肠癌的预测和预后价值中体现。
Deep Learning (DL) can predict biomarkers from cancer histopathology. Several clinically approved applications use this technology. Most approaches, however, predict categorical labels, whereas biomarkers are often continuous measurements. We hypothesized that regression-based DL outperforms classification-based DL. Therefore, we developed and evaluated a new self-supervised attention-based weakly supervised regression method that predicts continuous biomarkers directly from images in 11,671 patients across nine cancer types. We tested our method for multiple clinically and biologically relevant biomarkers: homologous repair deficiency (HRD) score, a clinically used pan-cancer biomarker, as well as markers of key biological processes in the tumor microenvironment. Using regression significantly enhances the accuracy of biomarker prediction, while also improving the interpretability of the results over classification. In a large cohort of colorectal cancer patients, regression-based prediction scores provide a higher prognostic value than classification-based scores. Our open-source regression approach offers a promising alternative for continuous biomarker analysis in computational pathology.
研究动机与目标
- 激发在从组织病理图像预测连续分子生物标志物时使用回归而非分类。
- 开发一个自监督、基于注意力的弱监督回归框架。
- 在大规模多癌种数据集及多种临床相关生物标志物上评估该方法。
- 评估在结直肠癌中回归得到的生物标志物分数的预后价值。
- 提供用于计算病理学中回归式连续生物标志物分析的开源工具。
提出的方法
- 提出一个自监督、基于注意力的弱监督回归模型,以从全切片图像预测连续生物标志物。
- 在11,671名患者、九种癌症类型上进行训练。
- 使用同源重组缺陷(HRD)评分等生物标志物及肿瘤微环境标志物进行评估。
- 在准确性和可解释性方面,将回归预测与分类对等进行比较。
- 在结直腸癌中评估回归分数的预后价值。
- 发布该回归方法的开源代码。
实验结果
研究问题
- RQ1回归型深度学习是否在从病理切片预测连续分子生物标志物方面优于分类模型?
- RQ2所提出的弱监督回归方法是否提高了生物标志物预测的可解释性?
- RQ3在结直肠癌中,回归得到的生物标志物分数是否比分类得分具有更强的预后信息?
- RQ4该方法在多种癌种和包括HRD评分及肿瘤微环境标志物在内的生物标志物上的表现如何?
主要发现
- 与分类相比,回归显著提升生物标志物预测的准确性。
- 回归提高了结果的可解释性,相较于分类。
- 在结直肠癌中,回归得到的分数显示出比分类分数更高的预后价值。
- 该方法在11,671名患者和九种癌症类型上进行了评估,突出其广泛适用性。
- 作者提供用于计算病理学中连续生物标志物分析的开源回归方法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。