Skip to main content
QUICK REVIEW

[論文レビュー] Vision Models for Medical Imaging: A Hybrid Approach for PCOS Detection from Ultrasound Scans

Md Mahmudul Hoque, Md. Mehedi Hassain|arXiv (Cornell University)|Jan 21, 2026
Ovarian function and disorders被引用数 1
ひとこと要約

論文は2つのCNN–Transformerハイブリッドモデル(DenConSTとDenConREST)をPCOS検出のための超音波画像から提案し、DenConRESTがテストセットで98.23%の精度を達成。

ABSTRACT

Polycystic Ovary Syndrome (PCOS) is the most familiar endocrine illness in women of reproductive age. Many Bangladeshi women suffer from PCOS disease in their older age. The aim of our research is to identify effective vision-based medical image analysis techniques and evaluate hybrid models for the accurate detection of PCOS. We introduced two novel hybrid models combining convolutional and transformer-based approaches. The training and testing data were organized into two categories: "infected" (PCOS-positive) and "noninfected" (healthy ovaries). In the initial stage, our first hybrid model, 'DenConST' (integrating DenseNet121, Swin Transformer, and ConvNeXt), achieved 85.69% accuracy. The final optimized model, 'DenConREST' (incorporating Swin Transformer, ConvNeXt, DenseNet121, ResNet18, and EfficientNetV2), demonstrated superior performance with 98.23% accuracy. Among all evaluated models, DenConREST showed the best performance. This research highlights an efficient solution for PCOS detection from ultrasound images, significantly improving diagnostic accuracy while reducing detection errors.

研究の動機と目的

  • 超音波画像によるPCOS検出の正確性を動機づけ、単一モデルアプローチの制限に対処する。
  • PCOS分類のために複数の事前学習済みアーキテクチャ(CNNとTransformer)の評価。
  • 補完的な特徴表現を活用するためのハイブリッドアンサンブルを開発・評価する。
  • 臨床またはリソース制約のある環境にも適した効率的で再現性のあるフレームワークを提供する。

提案手法

  • Kaggleからデータを収集し、感染(PCOS)と非感染カテゴリに分割し、訓練/テストセットを作成。
  • 画像前処理には破損画像の除去、224×224へのリサイズ、PyTorchテンソルへの変換、0-1スケーリング、ImageNet正規化を含む。
  • 5つの事前学習モデル(EfficientNetV2、ResNet18、DenseNet121、Swin Transformer、ConvNeXt)を二値分類の転移学習でファインチューニング。
  • ハイブリッドモデルDenConST(DenseNet121、Swin Transformer、ConvNeXt)とDenConREST(5モデルすべて)を構築し予測をアンサンブル。
  • 予測はロジットを平均化して集約し、Adam最適化手法、CrossEntropyLoss、学習率1e-4〜1e-3、バッチサイズ32(CNN)/16(Transformer)、100エポックで訓練。
  • 評価は共通のホールドアウトテストセットでの正確度、適合率、再現率、F1スコアを用いた。

実験結果

リサーチクエスチョン

  • RQ1ハイブリッドCNN–Transformerアンサンブルは個別モデルよりPCOS検出精度を向上させるか。
  • RQ2個々のアーキテクチャ(CNN対Transformer)は超音波PCOS分類でどのように比較されるか。
  • RQ3複数モデルをエンサンブルすること(DenConST対DenConREST)が再現率と適合率に与える影響はどれか。
  • RQ4提案フレームワークは臨床導入および資源制限環境に対して十分に堅牢か。

主な発見

ModelAccuracyPrecisionRecallF1 Score
Swin Transformer0.56450.58960.87640.7050
ConvNeXt0.58840.59940.92460.7273
DenseNet1210.68830.68790.86940.7681
ResNet180.59370.59371.00000.7450
EfficientNetV20.79550.92790.71080.8050
DenConST (Hybrid)0.85690.88320.87470.8789
DenConREST (Hybrid)0.98230.97190.99910.9849
  • DenConRESTは最高の性能を示し、精度98.23%、精度0.9719、再現率0.9991、F1スコア0.9849を達成。
  • ハイブリッドとしてのDenConSTは精度85.69%およびF1スコア0.8789に達成。
  • EfficientNetV2、ResNet18、DenseNet121、Swin Transformer、ConvNeXtは個別にはハイブリッドより低い指標を示し、EfficientNetV2は精度79.55%である。
  • DenConRESTの混同行列は1141件中1140件の感染有りの正分類、781件中748件の非感染の正分類(総計1,922件中1,190件正解)。
  • 本研究はハイブリッドアンサンブルが指標間のバランスを改善し、PCOSの高感度スクリーニングに適していると報告する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。