[논문 리뷰] A CNN-based methodology for breast cancer diagnosis using thermal images
이 연구는 열화상 영상을 사용한 CNN 기반의 컴퓨터 지원 진단 시스템을 제안하여, 데이터 증강과 최적화된 초모수 설정이 성능 향상에 크게 기여함을 입증한다. 이 방법은 57명의 환자로 구성된 데이터셋에서 92%의 정확도와 92%의 F1 스코어를 달성하며, ResNet50 및 Inception과 같은 최신 기술 모델들을 능가한다. 또한 데이터 증강을 통해 동일한 성능를 달성하기 위해 필요한 데이터베이스 크기를 50% 감소시킬 수 있다.
Micro Abstract: A recent study from GLOBOCAN disclosed that during 2018 two million women worldwide had been diagnosed from breast cancer. This study presents a computer-aided diagnosis system based on convolutional neural networks as an alternative diagnosis methodology for breast cancer diagnosis with thermal images. Experimental results showed that lower false-positives and false-negatives classification rates are obtained when data pre-processing and data augmentation techniques are implemented in these thermal images. Background: There are many types of breast cancer screening techniques such as, mammography, magnetic resonance imaging, ultrasound and blood sample tests, which require either, expensive devices or personal qualified. Currently, some countries still lack access to these main screening techniques due to economic, social or cultural issues. The objective of this study is to demonstrate that computer-aided diagnosis(CAD) systems based on convolutional neural networks (CNN) are faster, reliable and robust than other techniques. Methods: We performed a study of the influence of data pre-processing, data augmentation and database size versus a proposed set of CNN models. Furthermore, we developed a CNN hyper-parameters fine-tuning optimization algorithm using a tree parzen estimator. Results: Among the 57 patients database, our CNN models obtained a higher accuracy (92\%) and F1-score (92\%) that outperforms several state-of-the-art architectures such as ResNet50, SeResNet50 and Inception. Also, we demonstrated that a CNN model that implements data-augmentation techniques reach identical performance metrics in comparison with a CNN that uses a database up to 50\% bigger. Conclusion: This study highlights the benefits of data augmentation and CNNs in thermal breast images. Also, it measures the influence of the database size in the performance of CNNs.
연구 동기 및 목표
- 모든 검사법의 한계를 극복하기 위해 열화상 영상을 활용한 신뢰성 있고 저비용의 유방암 진단 시스템을 개발한다.
- 데이터 전처리, 데이터 증강, 데이터베이스 크기의 영향을 CNN 성능에 미치는 영향을 평가한다.
- 모델 일반화 능력을 향상시키기 위해 트리 파르젠 추정기 기반 초모수 최적화를 수행한다.
- DMR-IR 열화상 영상 데이터베이스에서 최신 기술 CNN 아키텍처의 성능을 비교 평가한다.
- 의료 영상의 저자료 환경에서 데이터 증강과 데이터베이스 크기 사이의 트레이드오프를 설정한다.
제안 방법
- 57명의 환자로 구성된 열화상 영상 데이터베이스(DMR-IR)를 기반으로 특수 설계된 CNN 아키텍처를 설계하고 훈련시켰으며, 편향과 과적합을 최소화하기 위해 신중한 데이터 분할 전략을 적용하였다.
- 이미지 품질 향상과 모델 수렴을 향상시키기 위해 정규화 및 향상 기법을 포함한 데이터 전처리를 수행하였다.
- 회전, 반전, 스케일링과 같은 데이터 증강 기법을 적용하여 훈련 세트를 인위적으로 확장하고 모델의 강건성을 향상시켰다.
- 트리 파르젠 추정기 기반 초모수 최적화 알고리즘을 사용하여 CNN 아키텍처 및 학습 파rameter를 정밀하게 조정하였다.
- 다양한 데이터베이스 크기와 증강 조건에서 여러 CNN 모델(ResNet50, Inception, VGG16 등)의 성능을 비교 평가하였다.
- 모델 성능 평가를 위해 정확도, 정밀도, 민감도, F1 스코어를 체계적으로 평가하였다.
실험 결과
연구 질문
- RQ1제한된 열화상 영상 데이터셋에서 데이터 증강은 CNN 기반의 유방암 진단 모델의 성능에 어떤 영향을 미치는가?
- RQ2저자료 환경에서 열화상 분류에 있어 데이터베이스 크기와 데이터 증강 사이의 최적의 트레이드오프는 무엇인가?
- RQ3더 단순하고 작은 CNN 아키텍처가 열화상 유방 영상에서 ResNet50 및 Inception과 같은 복잡한 최신 기술 모델을 능가할 수 있는가?
- RQ4트리 파르젠 추정기를 활용한 초모수 최적화는 모델 정확도와 일반화 능력에 어떤 영향을 미치는가?
- RQ5전처리 및 데이터 분할 전략은 열화상 유방 영상에서 CNN 학습 시 과적합과 편향을 얼마나 줄이는가?
주요 결과
- 제안된 CNN 모델은 DMR-IR 데이터셋에서 92%의 정확도, 94%의 정밀도, 91%의 민감도, 92%의 F1 스코어를 달성하여 ResNet50, SeResNet50, Inception을 능가하였다.
- 모든 데이터베이스 크기에서 데이터 증강을 적용한 모델은 증강 없이 학습한 모델 대비 평균 F1 스코어를 최소 10% 향상시켰다.
- 20명의 환자 데이터셋을 사용한 데이터 증강 기반 모델은 30명의 환자 데이터셋을 사용한 비증강 모델과 동일한 성능을 달성하였다.
- 데이터 증강을 통해 성능 지표의 분산이 크게 감소하여, 증강 없이 10명의 환자 데이터를 사용한 경우 16%에서 증강을 적용한 47명의 환자 데이터를 사용한 경우 4%로 감소하였다. 이는 더 높은 모델 강건성을 의미한다.
- 성능 지표는 40명에서 47명의 환자 사이에서 안정화되었으며, 이 이상의 데이터 양에서는 수익 감소 효과가 나타나고, 분산 증가율도 최소한이었다.
- 본 연구는 DMR-IR 열화상 영상 데이터베이스에서 여러 CNN 아키텍처의 첫 번째 벤치마크를 수립하였으며, 이 데이터셋에 대해 트리 파르젠 추정기를 활용한 초모수 최적화의 첫 사례를 제시하였다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.