QUICK REVIEW

[论文解读] A Comparative Study of CNN, BoVW and LBP for Classification of Histopathological Images

Meghana Dinesh Kumar, Morteza Babaie|arXiv (Cornell University)|Sep 27, 2017

AI in cancer detection参考文献 29被引用 25

一句话总结

本文介绍了 KIMIA Path960 数据集，这是一个小型、公开可用的组织学图像集合，包含 960 幅来自 20 种组织类型的图像，并对比了三种图像表征方法——LBP、深度特征（通过预训练的 AlexNet 和 VGG16）以及 BoVW 在分类任务中的表现。采用留一法验证，BoVW 达到最高准确率（96.50%），优于 LBP（90.62%）和深度特征（使用 VGG16 时为 94.72%）。

ABSTRACT

Despite the progress made in the field of medical imaging, it remains a large area of open research, especially due to the variety of imaging modalities and disease-specific characteristics. This paper is a comparative study describing the potential of using local binary patterns (LBP), deep features and the bag-of-visual words (BoVW) scheme for the classification of histopathological images. We introduce a new dataset, \emph{KIMIA Path960}, that contains 960 histopathology images belonging to 20 different classes (different tissue types). We make this dataset publicly available. The small size of the dataset and its inter- and intra-class variability makes it ideal for initial investigations when comparing image descriptors for search and classification in complex medical imaging cases like histopathology. We investigate deep features, LBP histograms and BoVW to classify the images via leave-one-out validation. The accuracy of image classification obtained using LBP was 90.62\% while the highest accuracy using deep features reached 94.72\%. The dictionary approach (BoVW) achieved 96.50\%. Deep solutions may be able to deliver higher accuracies but they need extensive training with a large number of (balanced) image datasets.

研究动机与目标

为医学图像分析中初始算法比较解决标准化、紧凑且公开可用的组织学图像数据集缺乏的问题。
评估并对比三种不同图像表征技术（LBP、深度特征与 BoVW）在组织学图像分类中的性能。
提供一个具有高类间与类内差异性的基准数据集（KIMIA Path960），以支持数字病理学的初步研究。
评估不同特征提取方法在计算复杂度、训练需求与分类准确率之间的权衡。

提出的方法

提出了一种名为 KIMIA Path960 的新型公开组织学图像数据集，包含来自 20 种不同组织类型的 960 幅图像。
应用局部二值模式（LBP）提取基于纹理的直方图，作为低维、不可训练的图像描述符。
通过在最后一个全连接层提取预训练卷积神经网络（AlexNet 和 VGG16）的深度特征，作为特征向量。
采用 k-means 聚类构建视觉词袋（BoVW）框架的视觉码本，随后使用支持向量机（IKSVM）和基于距离的分类器进行分类。
将图像重采样为 256×256 和 512×512 用于 BoVW 实验，采用重叠与非重叠网格策略提取局部特征。
使用留一法交叉验证评估所有方法，并测试多种相似性度量（L1、L2、余弦、χ²）在深度特征与 BoVW 中的表现。

实验结果

研究问题

RQ1在具有高类间与类内差异性的小型多样化数据集上，LBP、深度特征与 BoVW 在组织学图像分类中的表现如何？
RQ2图像分辨率与网格策略（重叠 vs. 非重叠）对基于 BoVW 的分类准确率有何影响？
RQ3在未进行微调的情况下，预训练的深度神经网络能否在小型、专业化的组织病理学数据集上实现高性能？
RQ4在 BoVW 框架中使用有监督分类器（IKSVM）是否显著优于无监督距离度量？
RQ5不同的距离度量（L1、L2、余弦、χ²）如何影响基于深度特征分类的性能？

主要发现

采用 IKSVM 与 512×512 图像分辨率的 BoVW 方法实现了 96.50% 的最高分类准确率，优于 LBP 与深度特征方法。
LBP 直方图实现了 90.62% 的分类准确率，表明其在无训练、低维特征条件下仍具有强大性能。
从 VGG16 提取的深度特征达到 94.72% 的准确率，优于 AlexNet（91.05%）与 LBP，但需要更高的计算资源与更多训练数据。
在 BoVW 中，8×8 网格策略优于 16×16 策略，因其能提供更精细的局部特征表示，尤其在码本规模较大时表现更优。
重叠网格策略在 BoVW 中始终优于非重叠策略，表明空间冗余有助于提升码本质量。
IKSVM 分类器在 BoVW 中显著优于基于距离的度量，表明有监督学习能从类特定决策边界中获益。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。