[论文解读] Vision Models for Medical Imaging: A Hybrid Approach for PCOS Detection from Ultrasound Scans
论文提出两种 CNN–Transformer 混合模型(DenConST 和 DenConREST)用于从超声图像检测多囊卵巢综合征(PCOS),其中 DenConREST 在测试集上的准确率达到 98.23%。
Polycystic Ovary Syndrome (PCOS) is the most familiar endocrine illness in women of reproductive age. Many Bangladeshi women suffer from PCOS disease in their older age. The aim of our research is to identify effective vision-based medical image analysis techniques and evaluate hybrid models for the accurate detection of PCOS. We introduced two novel hybrid models combining convolutional and transformer-based approaches. The training and testing data were organized into two categories: "infected" (PCOS-positive) and "noninfected" (healthy ovaries). In the initial stage, our first hybrid model, 'DenConST' (integrating DenseNet121, Swin Transformer, and ConvNeXt), achieved 85.69% accuracy. The final optimized model, 'DenConREST' (incorporating Swin Transformer, ConvNeXt, DenseNet121, ResNet18, and EfficientNetV2), demonstrated superior performance with 98.23% accuracy. Among all evaluated models, DenConREST showed the best performance. This research highlights an efficient solution for PCOS detection from ultrasound images, significantly improving diagnostic accuracy while reducing detection errors.
研究动机与目标
- 为实现从超声成像中准确检测 PCOS 提供动机,解决单一模型方法的局限性。
- 评估多种预训练架构(CNN 与 Transformer)在 PCOS 分类中的表现。
- 开发并评估混合集成,以利用互补的特征表示。
- 提供一个在临床或资源受限环境中可行、可重复的框架。
提出的方法
- 数据来自 Kaggle 并按感染(PCOS)与非感染类别分割为训练/测试集。
- 图像预处理包括去除损坏图像、调整大小到 224x224、转换为 PyTorch 张量、0-1 归一化以及 ImageNet 标准化。
- 五个预训练模型(EfficientNetV2、ResNet18、DenseNet121、Swin Transformer、ConvNeXt)通过迁移学习进行二分类微调。
- 混合模型 DenConST(DenseNet121、Swin Transformer、ConvNeXt)和 DenConREST(全部五个模型)用于对预测进行集成。
- 通过对数几率平均聚合预测,使用 Adam 优化器、CrossEntropyLoss、学习率 1e-4 至 1e-3、批量大小 32(CNN)/16(Transformer),训练 100 个时期。
- 评估在共用的保留测试集上使用准确率、精确率、召回率和 F1-score。
实验结果
研究问题
- RQ1混合 CNN–Transformer 集成是否比单一模型在 PCOS 检 detection 上更准确?
- RQ2单独架构(CNN 与 Transformers)在超声 PCOS 分类上有何比较?
- RQ3在集成中包含多模型对召回率和精确率的影响(DenConST 与 DenConREST)?
- RQ4拟议框架是否足够稳健,适用于临床部署和资源受限环境?
主要发现
- DenConREST 取得最佳性能,准确率 98.23%、精确率 97.19%、召回率 99.91%、F1-score 98.49%。
- DenConST 作为混合模型达到 85.69% 的准确率和 0.8789 的 F1-score。
- EfficientNetV2、ResNet18、DenseNet121、Swin Transformer 与 ConvNeXt 单独的指标均低于混合模型,其中 EfficientNetV2 的准确率为 79.55%。
- DenConREST 的混淆矩阵显示 1141 例感染正确分类,781 例非感染正确分类(共 1190/1922 正确)。
- 研究报告称混合集成在各指标上实现更好平衡,适用于高灵敏度 PCOS 筛查。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。