[论文解读] Deep-Learning for Classification of Colorectal Polyps on Whole-Slide Images
本研究提出一种基于残差神经网络(ResNet)的深度学习系统,用于自动分类全切片H&E染色组织学图像中的五种结直肠息肉类型。该模型在239个独立测试案例中实现了93.0%的准确率、89.7%的精确率、88.3%的召回率和88.8%的F1分数,证明其在辅助病理科医生进行组织病理学特征分析和风险评估方面具有高度有效性。
Histopathological characterization of colorectal polyps is an important principle for determining the risk of colorectal cancer and future rates of surveillance for patients. This characterization is time-intensive, requires years of specialized training, and suffers from significant inter-observer and intra-observer variability. In this work, we built an automatic image-understanding method that can accurately classify different types of colorectal polyps in whole-slide histology images to help pathologists with histopathological characterization and diagnosis of colorectal polyps. The proposed image-understanding method is based on deep-learning techniques, which rely on numerous levels of abstraction for data representation and have shown state-of-the-art results for various image analysis tasks. Our image-understanding method covers all five polyp types (hyperplastic polyp, sessile serrated polyp, traditional serrated adenoma, tubular adenoma, and tubulovillous/villous adenoma) that are included in the US multi-society task force guidelines for colorectal cancer risk assessment and surveillance, and encompasses the most common occurrences of colorectal polyps. Our evaluation on 239 independent test samples shows our proposed method can identify the types of colorectal polyps in whole-slide images with a high efficacy (accuracy: 93.0%, precision: 89.7%, recall: 88.3%, F1 score: 88.8%). The presented method in this paper can reduce the cognitive burden on pathologists and improve their accuracy and efficiency in histopathological characterization of colorectal polyps, and in subsequent risk assessment and follow-up recommendations.
研究动机与目标
- 解决结直肠息肉组织病理学特征分析中存在较高的观察者间和观察者内变异性的挑战。
- 通过自动化全切片图像中息肉类型的分类,减轻病理科医生的认知负担。
- 提高识别高危息肉(尤其是无蒂锯齿状息肉和增生性息肉)的诊断准确性和一致性。
- 基于息肉类型,支持准确的风险评估和随访监测建议。
- 开发一种可扩展的深度学习框架,可应用于结直肠癌以外的更广泛组织病理学分析。
提出的方法
- 该方法采用在H&E染色结直肠息肉全切片图像上训练的深度残差神经网络(ResNet)架构。
- 模型在239张独立的全切片图像上进行端到端训练,并通过数据增强提高鲁棒性。
- 采用基于图像块的策略执行全切片推理,整合多个图像块的预测结果。
- 系统将五类息肉类型进行分类:增生性息肉、无蒂锯齿状息肉、传统锯齿状腺瘤、管状腺瘤以及管状绒毛状/绒毛状腺瘤。
- 使用标准指标(准确率、精确率、召回率和F1分数)评估模型性能。
- 未来工作计划采用可视化技术以解释模型决策过程,提升透明度。
实验结果
研究问题
- RQ1深度学习模型能否在全切片H&E染色图像中实现对五类主要结直肠息肉类型的高精度分类?
- RQ2该模型在区分形态学相似的息肉(如增生性息肉与无蒂锯齿状息肉)方面表现如何?
- RQ3在本组织病理学任务中,数据增强在多大程度上提升了分类性能?
- RQ4该模型能否降低观察者间变异并支持结直肠癌筛查中的标准化风险评估?
- RQ5可解释人工智能技术在多大程度上可增强病理科医生对深度学习在数字病理学中临床应用的信任与采纳?
主要发现
- 该模型在239张独立全切片图像上实现了93.0%的整体准确率,表现出强劲的分类性能。
- 精确率和召回率分别为89.7%和88.3%,F1分数为88.8%,表明各类别间性能均衡。
- 混淆矩阵显示,误分类最常发生在增生性息肉与无蒂锯齿状息肉之间,与已知的诊断挑战一致。
- 模型倾向于将低置信度的正常病例分类为“正常”,这可能是由于训练集中类别多样性所致。
- 数据增强被证明可正向提升模型准确率,支持其在提高鲁棒性方面的应用。
- 该系统在临床整合方面展现出巨大潜力,可辅助病理科医生进行风险评估和随访规划。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。