[논문 리뷰] Eye Disease Classification Using Deep Learning Techniques
논문은 EfficientNet을 사용한 CNN과 전이 학습을 비교하여 다중 클래스 눈 질환 분류(정상, 백내장, 당뇨성 망막병증, 녹내장)를 수행하며, 전이 학습으로 94%의 정확도, CNN으로는 84%의 정확도를 달성한다.
Eye is the essential sense organ for vision function. Due to the fact that certain eye disorders might result in vision loss, it is essential to diagnose and treat eye diseases early on. By identifying common eye illnesses and performing an eye check, eye care providers can safeguard patients against vision loss or blindness. Convolutional neural networks (CNN) and transfer learning were employed in this study to discriminate between a normal eye and one with diabetic retinopathy, cataract, or glaucoma disease. Using transfer learning for multi-class classification, high accuracy was achieved at 94% while the traditional CNN achieved 84% rate.
연구 동기 및 목표
- 시력 손실 위험과 안과 의사 접근성의 제한으로 인한 시력질환의 조기 발견을 촉진한다.
- 전이 학습이 CNN 기반의 시력 질환 분류를 개선하는지 조사한다.
- 정상, 백내장, 당뇨성 망막병증, 녹내장 네 가지 클래스의 데이터셋에서 표준 지표를 사용해 성능을 평가한다.
- 시력 질환 분류를 위한 사전 학습된 모델로 EfficientNet을 활용하여 전이 학습을 수행한다.
제안 방법
- 사전 학습된 EfficientNet 아키텍처를 사용한 CNN과 전이 학습을 이용한다.
- 일반화 향상을 위해 512x512x3에서 224x224x3으로 이미지를 재스케일링한다.
- 데이터를 70% 학습, 20% 테스트, 10% 검증으로 분할한다.
- 정밀도, 재현율, F1-score, 그리고 정확도를 사용하여 평가한다.
- 정확도/손실 플롯과 혼동 행렬을 통해 학습 동향을 비교한다.
실험 결과
연구 질문
- RQ1전이 학습이 다중 클래스 시력 질환 분류에서 CNN의 정확도를 향상시키는가?
- RQ2정상, 백내장, 당뇨성 망막병증, 녹내장 각각에 대해 CNN과 전이 학습의 클래스별 성능 차이는 무엇인가?
- RQ3Color fundus 이미지에서 Automatic eye disease screening을 위한 EfficientNet 기반 전이 학습은 효과적인가?
주요 결과
| 모델 | 클래스 | 정밀도(%) | 재현율(%) | F1-스코어(%) | 정확도(%) |
|---|---|---|---|---|---|
| CNN | cataract | 87 | 96 | 91 | 84 |
| CNN | Diabetic retinopathy | 100 | 100 | 100 | |
| CNN | Glaucoma | 67 | 85 | 75 | |
| CNN | Normal | 86 | 56 | 68 | |
| Transfer Learning | cataract | 97 | 96 | 96 | 94 |
| Transfer Learning | Diabetic retinopathy | 100 | 99 | 99 | |
| Transfer Learning | Glaucoma | 94 | 85 | 89 | |
| Transfer Learning | Normal | 86 | 96 | 91 |
- 전이 학습이 더 높은 정확도(94%)를 달성했다.
- 당뇨성 망막병증은 두 방법 모두에서 매우 높은 성능을 보인다(CNN: 100% precision/recall/F1; TL: 100% precision, 99% recall, 99% F1).
- Normal 클래스의 경우 TL은 86% precision, 96% recall, 91% F1를 달성했고; CNN은 86% precision, 56% recall, 68% F1를 달성했다.
- Cataract 클래스: TL(97% precision, 96% recall, 96% F1); CNN(87% precision, 96% recall, 91% F1).
- Glaucoma 클래스: TL(94% precision, 85% recall, 89% F1); CNN(67% precision, 85% recall, 75% F1).
- 전이 학습은 CNN에 비해 더 부드러운 학습 정확도/손실 곡선과 혼동 행렬의 뚜렷한 개선을 보였다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.