QUICK REVIEW

[논문 리뷰] Histopathologic Image Processing: A Review

Jonathan de Matos, Alceu de Souza Britto|arXiv (Cornell University)|2019. 04. 16.

AI in cancer detection참고 문헌 100인용 수 24

한 줄 요약

이 논문은 히스토파스ولوج적 영상(HI) 처리를 위한 기계학습 기법에 대한 종합적인 리뷰를 제시하며, 얕은 학습과 깊은 학습 방법을 활용한 분할, 특징 추출, 분류에 중점을 둔다. 본 연구는 InceptionV3를 사용한 전이 학습과 패치 기반 데이터 증강을 조합한 하이브리드 접근법을 제안하여 관련이 없는 영상 패치를 걸러내며, 유방암 분류에서 91%의 정확도를 달성하여 기준 방법을 능가한다.

ABSTRACT

Histopathologic Images (HI) are the gold standard for evaluation of some tumors. However, the analysis of such images is challenging even for experienced pathologists, resulting in problems of inter and intra observer. Besides that, the analysis is time and resource consuming. One of the ways to accelerate such an analysis is by using Computer Aided Diagnosis systems. In this work we present a literature review about the computing techniques to process HI, including shallow and deep methods. We cover the most common tasks for processing HI such as segmentation, feature extraction, unsupervised learning and supervised learning. A dataset section show some datasets found during the literature review. We also bring a study case of breast cancer classification using a mix of deep and shallow machine learning methods. The proposed method obtained an accuracy of 91% in the best case, outperforming the compared baseline of the dataset.

연구 동기 및 목표

히스토파스ولوج적 영상(HI) 처리를 위한 최신 컴퓨팅 기법, 즉 얕은 학습과 깊은 학습 방법을 검토하고 통합하는 것.
히스토파스ولوج적 영상(HI) 데이터셋의 레이블이 부족한 문제를 해결하기 위해 데이터 증강 및 특징 필터링 전략을 제안하여 분류 성능을 향상시키는 것.
사전 훈련된 InceptionV3를 통한 깊은 특징과 얕은 분류기(SVM)를 조합하여 히스토파스ولوج적 영상 분류의 효과를 평가하는 것.
PCA로 감소된 깊은 특징를 사용해 정보량이 적은 패치를 걸러내는 것이 분류 정확도와 모델의 강건성에 미치는 영향을 조사하는 것.
데이터 부족 문제를 극복하기 위해 전이 학습과 패치 기반 처리가 히스토파스ولوج적 영상 분석에서 실현 가능함을 보여주는 것.

제안 방법

연구는 히스토파스ولوج적 영상 처리 기법에 대한 문헌 리뷰를 수행하며, 데이터셋, 비지도 및 지도 학습 기반의 얕은 학습 방법, 딥 러닝, 관련 리뷰를 포함한다.
사례 연구에서는 유방암(BreaKHis)과 대장암(CRC)의 전체 슬라이드 영상에서 다양한 훈련 샘플을 생성하기 위해 패치 기반 데이터 증강을 적용한다.
사전 훈련된 InceptionV3 네트워크를 사용해 깊은 특징를 추출한 후, 주성분 분석(PCA)을 통해 100, 200, 400, 600개의 성분으로 차원 감소를 수행한다.
PCA로 감소된 깊은 특징를 기반으로 정보량이 적은 패치를 걸러내는 필터링 메커니즘이 도입되어 데이터셋 크기를 줄이면서도 관련 영역을 유지한다.
다양한 확대 수준(40x, 100x, 200x, 400x)에서 필터링된 패치와 필터링되지 않은 패치를 대상으로 SVM 분류기를 훈련시어 성능을 평가한다.
5겹 교차 검증을 통해 필터링된 패치 세트와 필터링되지 않은 패치 세트를 비교하며, 각 구성에 대해 정확도와 표준편차를 보고한다.

실험 결과

연구 질문

RQ1패치 기반 데이터 증강과 깊은 특징 필터링을 조합하면 히스토파스ولوج적 영상 분석의 분류 정확도 향상에 기여하는가?
RQ2InceptionV3를 통한 사전 훈련된 깊은 특징와 PCA 기반 차원 감소가 정보량이 많은 패치 선택에 어떤 영향을 미치는가?
RQ3깊은 특징를 사용해 정보량이 적은 패치를 걸러내는 것이 모든 패치를 사용하는 것보다 분류 작업에서 더 나은 성능을 내는가?
RQ4다양한 확대 수준이 패치 필터링의 효과성과 분류 정확도에 어떤 영향을 미치는가?
RQ5대규모 데이터셋(ImageNet)에서의 전이 학습이 히스토파스ولوج적 영상 분류 작업에서의 데이터 부족 문제를 완화하는 데 기여하는가?

주요 결과

깊은 특징와 PCA를 활용한 패치 필터링 방법은 관련 없는 패치를 줄이면서도 분류 성능 유지를 또는 향상시켰다.
최고의 분류 정확도 91%는 100x 확대 수준에서 200차원 깊은 특징를 사용한 필터링된 패치에서 달성되었으며, 기준 방법을 능가했다.
16개의 교차 검증 폴드 중 13개에서 필터링이 성능 향상에 기여했으며, 오직 한 폴드(40x, 200개 특징)에서 약간의 성능 저하가 관찰되었다.
200x 확대 수준에서는 모든 특징 차원에서 필터링 과정이 일관되게 성능 향상에 기여했으며, 100개 특징에서 정확도는 90.3%(표준편차: 3.4)에 도달했다.
2048차원 특징를 600차원으로 감소시키는 데서도 누적 분산의 95%를 유지하여 효과적인 차원 감소가 가능함을 확인했다.
본 연구는 전이 학습과 패치 필터링을 조합하는 것이 데이터 부족 상황에서의 모델 성능 향상에 실현 가능한 전략임을 확인했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.