[论文解读] Semi-Supervised Histology Classification using Deep Multiple Instance Learning and Contrastive Predictive Coding
本文提出一个结合对比预测编码(CPC)与基于注意力的MIL的两阶段半监督流程,在标注有限的情况下改善组织病理切片分类,在BACH数据上实现了 state-of-the-art 结果。
Convolutional neural networks can be trained to perform histology slide classification using weak annotations with multiple instance learning (MIL). However, given the paucity of labeled histology data, direct application of MIL can easily suffer from overfitting and the network is unable to learn rich feature representations due to the weak supervisory signal. We propose to overcome such limitations with a two-stage semi-supervised approach that combines the power of data-efficient self-supervised feature learning via contrastive predictive coding (CPC) and the interpretability and flexibility of regularized attention-based MIL. We apply our two-stage CPC + MIL semi-supervised pipeline to the binary classification of breast cancer histology images. Across five random splits, we report state-of-the-art performance with a mean validation accuracy of 95% and an area under the ROC curve of 0.968. We further evaluate the quality of features learned via CPC relative to simple transfer learning and show that strong classification performance using CPC features can be efficiently leveraged under the MIL framework even with the feature encoder frozen.
研究动机与目标
- 解决在有限标记的组织病理数据下深度 MIL 的过拟合和特征学习不足问题。
- 利用自监督的 CPC 从未标记的补丁中学习丰富的实例级表示。
- 将 CPC 特征与正则化的注意力型 MIL 融合,实现有效的袋级分类。
- 通过冻结编码器来实现内存高效训练,同时保持性能。
提出的方法
- 在一个基于注意力的 MIL 框架中将每张图像视为一个补丁袋。
- 在未标记补丁上使用自监督 CPC 进行特征编码器的预训练,以学习组织病理特异性表示。
- 使用带 KL 散度正则化的边际损失,以防止对负实例过拟合。
- 可选地迁移 ImageNet 预训练的特征或 CPC 特征,编码器被冻结或微调。
- 通过冻结编码器并在注意力 MIL 网络前添加一个紧凑的线性层,实现内存高效训练。
实验结果
研究问题
- RQ1CPC 基于预训练是否能在有限标注下改善 MIL 基于的组织病理分类?
- RQ2在 BACH 数据集上,CPC + MIL 与标准 MIL 及迁移学习相比表现如何?
- RQ3冻结编码器对性能和训练效率有何影响?
- RQ4正则化(KL-div)与平滑边缘损失是否能缓解负袋过度关注?
- RQ5达到强 AUC 性能需要多少标注在 CPC + MIL?
主要发现
- 在五个随机拆分中,MIL + CPC 结合平滑 SVM 损失和 KL-div 正则化实现了 95.0% 的准确性和 0.968 的 AUC。
- MIL + CPC 结合 ImageNet 预训练的准确性为 91.8%,AUC 为 0.959,而仅使用 ImageNet 的表现较差。
- 冻结 CPC 特征并使用 MIL 可达到 90.6% 的准确性和 0.939 的 AUC,从而实现内存高效训练。
- CPC 特征使在编码器冻结时也能实现强分类性能,将可训练参数数量降至 80 万以下。
- 使用 CPC + MIL 的训练在每类仅需 16 个标注时也能表现良好,平均 AUC 超过 0.82(图 3)。
- 注意力图集中在核密度高的区域和信息量丰富区域,有时错过了坏死或迁移细胞区域。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。