QUICK REVIEW

[논문 리뷰] A Comparative Study of CNN, BoVW and LBP for Classification of Histopathological Images

Meghana Dinesh Kumar, Morteza Babaie|arXiv (Cornell University)|2017. 09. 27.

AI in cancer detection참고 문헌 29인용 수 25

한 줄 요약

이 논문은 20개의 조직 유형에서 온 960장의 조직병리학적 영상으로 구성된 작고 공개 가능한 KIMIA Path960 데이터셋을 소개하며, 분류를 위해 LBP, 딥 페처(사전 훈련된 AlexNet 및 VGG16를 통한), BoVW 세 가지 이미지 표현 방법을 비교한다. 이면 검증을 사용하여 BoVW가 가장 높은 정확도(96.50%)를 기록했으며, LBP(90.62%)와 딥 페처(94.72% VGG16 기준)를 능가했다.

ABSTRACT

Despite the progress made in the field of medical imaging, it remains a large area of open research, especially due to the variety of imaging modalities and disease-specific characteristics. This paper is a comparative study describing the potential of using local binary patterns (LBP), deep features and the bag-of-visual words (BoVW) scheme for the classification of histopathological images. We introduce a new dataset, \emph{KIMIA Path960}, that contains 960 histopathology images belonging to 20 different classes (different tissue types). We make this dataset publicly available. The small size of the dataset and its inter- and intra-class variability makes it ideal for initial investigations when comparing image descriptors for search and classification in complex medical imaging cases like histopathology. We investigate deep features, LBP histograms and BoVW to classify the images via leave-one-out validation. The accuracy of image classification obtained using LBP was 90.62\% while the highest accuracy using deep features reached 94.72\%. The dictionary approach (BoVW) achieved 96.50\%. Deep solutions may be able to deliver higher accuracies but they need extensive training with a large number of (balanced) image datasets.

연구 동기 및 목표

의료 영상 분석 분야에서 초기 알고리즘 비교를 위한 표준화되고 작고 공개 가능한 조직병리학적 영상 데이터셋의 부족을 해결하기 위해.
조직병리학적 영상 분류에서 세 가지 다른 이미지 표현 기법—LBP, 딥 페처, BoVW—의 성능을 평가하고 비교하기 위해.
초기 디지털 병리학 연구를 지원하기 위해 높은 반류 및 내류 변이성을 가진 벤치마크 데이터셋(KIMIA Path960)을 제공하기 위해.
다양한 특징 추출 방법 간의 계산 복잡도, 훈련 요구사항 및 분류 정확도 간의 상호 상충 관계를 평가하기 위해.

제안 방법

20개의 다른 조직 유형에서 온 960장의 영상으로 구성된 새로운 공개 데이터셋인 KIMIA Path960을 제안하였다.
로컬 이진 패턴(LBP)을 적용하여 저차원, 훈련 불필요 이미지 기술자로 텍스처 기반 히스토GRAM을 추출하였다.
최종 완전 연결층을 특징 벡터로 사용하여 사전 훈련된 컨volutional 신경망(AlexNet 및 VGG16)에서 딥 페처를 추출하였다.
k-means 군집화를 사용하여 시각적 코드북을 구축한 후, SVM(IKSVM) 및 거리 기반 분류기로 분류를 수행하기 위해 Bag-of-Visual-Words(BoVW) 프레임워크를 구현하였다.
BoVW 실험을 위해 영상을 256×256 및 512×512로 리사이징하였으며, 국소 특징을 추출하기 위해 겹치는 것과 겹치지 않는 격자 전략을 사용하였다.
모든 방법을 이면 검증을 사용하여 평가하였으며, 딥 페처 및 BoVW에 대해 다양한 유사도 측정법(L1, L2, 코사인, χ²)을 테스트하였다.

실험 결과

연구 질문

RQ1높은 반류 및 내류 변이성을 가진 소규모이고 다양한 데이터셋에서 LBP, 딥 페처, BoVW는 조직병리학적 영상 분류에 어떻게 성능을 발휘하는가?
RQ2이미지 해상도와 격자 전략(겹침 대비 겹치지 않음)은 BoVW 기반 분류 정확도에 어떤 영향을 미치는가?
RQ3미세조정 없이도 사전 훈련된 딥 네트워크가 소규모 전문화된 조직병리학 데이터셋에서 높은 성능을 달성할 수 있는가?
RQ4BoVW 프레임워크에서 비지도 학습 거리 기반 측정법 대비 지도 학습 분류기(IKSVM) 사용이 성능 향상에 상당한 기여를 하는가?
RQ5다양한 거리 측정법(L1, L2, 코사인, χ²)은 딥 페처 기반 분류 성능에 어떤 영향을 미치는가?

주요 결과

512×512 이미지 해상도와 IKSVM를 사용한 BoVW 접근 방식이 가장 높은 분류 정확도 96.50%를 기록했으며, LBP 및 딥 페처를 모두 능가했다.
LBP 히스토GRAM은 90.62%의 분류 정확도를 기록하여, 훈련 불필요이자 저차원임에도 불구하고 뛰어난 성능을 보였다.
VGG16에서 추출한 딥 페처는 94.72%의 정확도를 기록하여 AlexNet(91.05%) 및 LBP를 뛰어넘었지만, 더 많은 계산 자원과 훈련 데이터가 필요했다.
8×8 격자 전략은 코드북 크기가 클수록 더 높은 정확도를 기록하여 16×16 전략보다 우수한 성능을 보였다. 이는 더 세밀한 국소 특징 표현 덕분이었다.
겹치는 격자 전략은 항상 겹치지 않는 전략보다 성능이 뛰어났으며, 이는 공간적 중복성이 코드북 품질 향상에 기여함을 시사한다.
IKSVM 분류기는 BoVW에서 거리 기반 측정법보다 뚜렷이 높은 성능을 보였으며, 이는 지도 학습이 클래스별 결합 경계를 효과적으로 학습할 수 있음을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.