Skip to main content
QUICK REVIEW

[논문 리뷰] Vision Models for Medical Imaging: A Hybrid Approach for PCOS Detection from Ultrasound Scans

Md Mahmudul Hoque, Md. Mehedi Hassain|arXiv (Cornell University)|2026. 01. 21.
Ovarian function and disorders인용 수 1
한 줄 요약

본 논문은 초음파 영상에서 PCOS 탐지를 위한 두 개의 CNN–Transformer 하이브리드 모델(DenConST, DenConREST)을 제안하며, DenConREST가 테스트 세트에서 98.23%의 정확도를 달성한다.

ABSTRACT

Polycystic Ovary Syndrome (PCOS) is the most familiar endocrine illness in women of reproductive age. Many Bangladeshi women suffer from PCOS disease in their older age. The aim of our research is to identify effective vision-based medical image analysis techniques and evaluate hybrid models for the accurate detection of PCOS. We introduced two novel hybrid models combining convolutional and transformer-based approaches. The training and testing data were organized into two categories: "infected" (PCOS-positive) and "noninfected" (healthy ovaries). In the initial stage, our first hybrid model, 'DenConST' (integrating DenseNet121, Swin Transformer, and ConvNeXt), achieved 85.69% accuracy. The final optimized model, 'DenConREST' (incorporating Swin Transformer, ConvNeXt, DenseNet121, ResNet18, and EfficientNetV2), demonstrated superior performance with 98.23% accuracy. Among all evaluated models, DenConREST showed the best performance. This research highlights an efficient solution for PCOS detection from ultrasound images, significantly improving diagnostic accuracy while reducing detection errors.

연구 동기 및 목표

  • 초음파 영상에서의 정확한 PCOS 탐지를 촉진하고, 단일 모델 접근의 한계를 다룬다.
  • PCOS 분류를 위한 다수의 사전학습된 아키텍처(CNN 및 트랜스포머)들의 성능을 평가한다.
  • 보완적인 특징 표현을 활용하기 위한 하이브리드 앙상블을 개발하고 평가한다.
  • 임상 또는 자원 한정 환경에 적합한 효율적이고 재현 가능한 프레임워크를 제공한다.

제안 방법

  • Kaggle에서 수집된 데이터를 감염된(PCOS)과 비감염(notinfected) 범주로 나누고 학습/테스트 세트를 구성했다.
  • 이미지 전처리에는 손상된 이미지 제거, 224×224로 리사이즈, PyTorch 텐서로의 변환, 0-1 정규화, ImageNet 정규화가 포함된다.
  • 다섯 가지 사전학습 모델(EfficientNetV2, ResNet18, DenseNet121, Swin Transformer, ConvNeXt)이 이진 분류를 위해 전이 학습으로 미세조정되었다.
  • 하이브리드 모델 DenConST( DenseNet121, Swin Transformer, ConvNeXt)와 DenConREST(다섯 모델 모두)를 구성하여 예측을 앙상블했다.
  • 로짓의 평균화를 통해 예측을 집계했고, Adam 옵티마이저, CrossEntropyLoss를 사용했으며 학습률은 1e-4~1e-3, 배치 크기는 CNN은 32, 트랜스포머는 16, 100회 에포크로 학습했다.
  • 평가 지표로 정확도, 정밀도, 재현율, F1 점수를 공통 보류 테스트 세트에서 사용했다.

실험 결과

연구 질문

  • RQ1하이브리드 CNN–Transformer 엔섬블이 개별 모델보다 PCOS 탐지 정확도를 향상시키는가?
  • RQ2개별 아키텍처(CNN 대 Transformer)는 초음파 PCOS 분류에서 어떻게 비교되는가?
  • RQ3다수의 모델을 앙상블에 포함시키는 것이( DenConST 대 DenConREST) 재현율과 정밀도에 어떤 영향을 미치는가?
  • RQ4제안된 프레임워크가 임상 배치 및 자원 제한 환경에 충분히 견고한가?

주요 결과

  • DenConREST가 98.23%의 정확도, 97.19%의 정밀도, 99.91%의 재현율, 98.49%의 F1-점수로 최상의 성능을 달성했다.
  • DenConST를 하이브리드로 구성하면 85.69%의 정확도와 0.8789의 F1-점수를 보인다.
  • 개별적으로 EfficientNetV2, ResNet18, DenseNet121, Swin Transformer, ConvNeXt은 하이브리드보다 낮은 지표를 보였고, EfficientNetV2의 정확도는 79.55%였다.
  • DenConREST의 혼동 행렬은 1141개 중 1140개를 정확하게 감염으로 분류했고, 비감염은 781개 중 748개를 정확하게 분류했다(총 1,922개 중 1,190개 정확).
  • 연구는 하이브리드 앙상블이 지표 간의 균형을 더 잘 제공하며 고민감도 PCOS 선별에 적합하다고 보고한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.