[논문 리뷰] DeepGleason: a System for Automated Gleason Grading of Prostate Cancer using Deep Neural Networks
DeepGleason은 ConvNeXt를 사용한 타일 단위의 딥 러닝 시스템으로 전체 슬라이드 전립선 암 영상에서 자동 Gleason 등급을 매기며 높은 매크로 F1, AUC, 및 정확도를 달성합니다.
Advances in digital pathology and artificial intelligence (AI) offer promising opportunities for clinical decision support and enhancing diagnostic workflows. Previous studies already demonstrated AI's potential for automated Gleason grading, but lack state-of-the-art methodology and model reusability. To address this issue, we propose DeepGleason: an open-source deep neural network based image classification system for automated Gleason grading using whole-slide histopathology images from prostate tissue sections. Implemented with the standardized AUCMEDI framework, our tool employs a tile-wise classification approach utilizing fine-tuned image preprocessing techniques in combination with a ConvNeXt architecture which was compared to various state-of-the-art architectures. The neural network model was trained and validated on an in-house dataset of 34,264 annotated tiles from 369 prostate carcinoma slides. We demonstrated that DeepGleason is capable of highly accurate and reliable Gleason grading with a macro-averaged F1-score of 0.806, AUC of 0.991, and Accuracy of 0.974. The internal architecture comparison revealed that the ConvNeXt model was superior performance-wise on our dataset to established and other modern architectures like transformers. Furthermore, we were able to outperform the current state-of-the-art in tile-wise fine-classification with a sensitivity and specificity of 0.94 and 0.98 for benign vs malignant detection as well as of 0.91 and 0.75 for Gleason 3 vs Gleason 4 & 5 classification, respectively. Our tool contributes to the wider adoption of AI-based Gleason grading within the research community and paves the way for broader clinical application of deep learning models in digital pathology. DeepGleason is open-source and publicly available for research application in the following Git repository: https://github.com/frankkramer-lab/DeepGleason.
연구 동기 및 목표
- 디지털 병리학에서 임상 의사결정을 지원하기 위한 자동 Gleason 등급 부여의 동기 부여.
- 타일 단위 전립선 암 등급 매기를 위한 오픈소스, 재사용 가능한 AI 도구 개발.
- 타일 단위 분류를 위한 최첨단 아키텍처를 전체 슬라이드 이미지에서 평가.
- 전문적으로 주석이 달린 대규모 전립선 타일 데이터셋에서 성능 벤치마크를 시연합니다.
제안 방법
- 전체 슬라이드 조직병리학 이미지에서의 타일 단위 이미지 분류.
- ConvNeXt 신경망과 결합된 미세 조정된 이미지 전처리 기술.
- 타이드 변환기(transformers)를 포함한 최첨단 아키텍처와의 ConvNeXt 비교.
- 369장의 슬라이드에서 주석이 달린 34,264개의 타일으로 구성된 내부 데이터셋으로의 학습 및 검증.
- AUCMEDI 프레임워크 내 구현 및 오픈소스 릴리스.
실험 결과
연구 질문
- RQ1타일 단위의 딥 러닝 모델이 전체 슬라이드 전립선 조직 병리 이미지에서 Gleason 등급을 정확하게 수행할 수 있는가?
- RQ2주어진 데이터셋에서 타일 단위 Gleason 분류에 대해 어떤 신경망 아키텍처가 우수한 성능을 제공하는가?
- RQ3제안된 시스템이 양성/음성 탐지 및 Gleason 등급 구분에 대해 임상적으로 관련된 지표를 충족하는가?
주요 결과
- 평가 데이터셋에서 매크로 평균 F1-스코어 0.806.
- AUC 0.991.
- 정확도 0.974.
- ConvNeXt가 이 데이터셋에서 변환기(transformer)를 포함한 다른 아키텍처보다 우수한 성능을 보임.
- 양성 대 음성 탐지: 민감도 0.94, 특이도 0.98.
- Gleason 3 대 Gleason 4 및 5 분류: 민감도 0.91, 특이도 0.75.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.