QUICK REVIEW

[논문 리뷰] Optimizing and Visualizing Deep Learning for Benign/Malignant Classification in Breast Tumors

Darvin Yi, Rebecca Lynn Sawyer|arXiv (Cornell University)|2017. 05. 17.

AI in cancer detection참고 문헌 12인용 수 49

한 줄 요약

이 연구는 DDSM 데이터셋의 1,000명 환자 서브셋을 사용하여 맘모그램 영상에 딥러닝을 적용해 양성/악성 종양을 분류한다. GoogLeNet 아키텍처를 활용해 85% 정확도와 0.91 AUC를 달성하며 수작업 특징 추출 방법을 능가하며, 임상적으로 유의미한 특징인 분포형을 드러내는 새로운 시각화 기법을 제안하여 모델의 해석 가능성과 진단 적합성을 입증한다.

ABSTRACT

Breast cancer has the highest incidence and second highest mortality rate for women in the US. Our study aims to utilize deep learning for benign/malignant classification of mammogram tumors using a subset of cases from the Digital Database of Screening Mammography (DDSM). Though it was a small dataset from the view of Deep Learning (about 1000 patients), we show that currently state of the art architectures of deep learning can find a robust signal, even when trained from scratch. Using convolutional neural networks (CNNs), we are able to achieve an accuracy of 85% and an ROC AUC of 0.91, while leading hand-crafted feature based methods are only able to achieve an accuracy of 71%. We investigate an amalgamation of architectures to show that our best result is reached with an ensemble of the lightweight GoogLe Nets tasked with interpreting both the coronal caudal view and the mediolateral oblique view, simply averaging the probability scores of both views to make the final prediction. In addition, we have created a novel method to visualize what features the neural network detects for the benign/malignant classification, and have correlated those features with well known radiological features, such as spiculation. Our algorithm significantly improves existing classification methods for mammography lesions and identifies features that correlate with established clinical markers.

연구 동기 및 목표

제한된 유방 mammogram 데이터를 활용한 딥러닝을 통해 유방암 스크리닝에서 양성/악성 분류 성능을 향상시키는 것.
CAD 시스템에서 수작업으로 설계된 특징의 한계를 극복하기 위해 데이터 기반 딥러닝을 활용하는 것.
학습된 특징을 알려진 방사선학적 마커와 연결함으로써 딥러닝 결정 과정을 해석할 수 있는 시각화 방법을 개발하는 것.
딥 네ural 네트워크가 분포형과 같은 임상적으로 중요한 특징을 학습할 수 있음을 입증하여 신뢰도와 임상 적용 가능성을 높이는 것.
다양한 시야(전후면 CC 및 사선 MLO)를 조합한 앙상블 모델을 평가하여 분류 정확도의 안정성을 향상시키는 것.

제안 방법

디지털 스크리닝 유방촬영 데이터베이스(DDSM)의 1,000명 환자 서브셋에서 경량 GoogLeNet 아키텍처를 처음부터 훈련시었다.
두 개의 별도 모델이 각각 전후면(CC) 및 사선면(MLO) 영상을 처리한 확률 점수를 평균하여 예측을 통합하였다.
제한된 데이터에서 일반화 능력을 향상시키기 위해 GoogLeNet 모델의 앙상블을 사용하여 분산을 줄였다.
클래스 점수를 최대화하는 이미지를 생성하기 위해 반복적인 확률적 경사 상승 기법을 사용하는 새로운 시각화 기법인 Directed Dream을 개발하였다.
Directed Dream 과정의 각 반복 단계에서 시각화된 중요도 맵을 활용해 네트워크가 학습한 고차원 특징을 분석하였다.
결과적으로 생성된 시각적 환각 이미지와 분포형과 같은 알려진 방사선학적 특징을 비교하여 임상적 관련성을 검증하였다.

실험 결과

연구 질문

RQ1작은 유방촬영 데이터셋에서 최신 딥러닝 모델이 양성/악성 분류에 대해 강력한 성능을 내는가?
RQ2CC 및 MLO 시야를 다수의 영상으로 조합한 앙상블 모델링 방식이 단일 시야 모델 대비 분류 성능을 어떻게 향상시키는가?
RQ3딥러닝 모델이 유방촬영에서 임상적으로 확립된 마커인 분포형과 유사한 특징을 학습할 수 있는가?
RQ4Directed Dream과 같은 시각화 기법이 딥 네URAL 네트워크의 의사결정 과정에서 의미 있고 해석 가능한 특징을 얼마나 잘 드러내는가?
RQ5공유된 모델 아키텍처를 통해 여러 시야를 통합하면 특징 공유 및 분류 정확도가 향상되는가?

주요 결과

딥러닝 모델은 1,000명 환자 유방촬영 데이터셋에서 85% 정확도와 ROC AUC 0.91을 달성하였으며, 수작업 특징 추출 방법(71% 정확도)을 크게 능가하였다.
CC 및 MLO 시야에 대해 GoogLeNet을 사용한 앙상블 모델링 방식이 확률 점수 평균을 통해 가장 높은 성능을 보였으며, 서로 다른 시야 간 공유된 특징 학습의 이점이 있음을 시사하였다.
Directed Dream 시각화 기법은 명확한 패턴을 생성하였으며, 악성 병변의 경우 별발사형 분포형 패턴을 유사하게 재현하였다.
양성 병변의 경우 원형으로 뭉쳐진 밝은 영역이 골고루 퍼진 '별이 빛나는 밤' 효과를 보였으며, 이는 악성 패턴과 대비되어 반대 방향의 특징 우선순위를 반영하였다.
악성 병변의 경우 시각화된 특징가 임상적으로 중요한 분포형과 강하게 상관되었으며, 모델이 진단적으로 의미 있는 패턴을 학습할 수 있음을 입증하였다.
반복적인 시각화 과정을 통해 단일 단계의 중요도 맵보다 더 높은 수준의 추상화된 특징을 드러내었으며, 깊은 신경망이 전문가 지식과 일치하는 복잡하고 해석 가능한 특징을 학습한다는 점을 입증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.