QUICK REVIEW

[논문 리뷰] A New Cervical Cytology Dataset for Nucleus Detection and Image Classification (Cervix93) and Methods for Cervical Nucleus Detection

Hady Ahmady Phoulady, Peter R. Mouton|arXiv (Cornell University)|2018. 11. 23.

Cervical Cancer and HPV Research참고 문헌 8인용 수 30

한 줄 요약

이 논문은 음성, LSIL, 또는 HSIL로 평가된 ThinPrep 슬라이드에서 유래한 93개의 실제 이미지 스택으로 구성된 새로운 공개된 자궁경부 세포학 데이터셋인 Cervix93을 소개한다. 이 데이터셋에는 수작업으로 주석 처리된 2,705개의 세포핵이 포함되어 있으며, 기준 방법과 CNN 기반의 세포핵 검출 방법을 제안한다. 이 두 방법 모두 이전 최고 성능 방법들을 능가하며, 특히 CNN은 F1-스코어 0.878을 기록하여 더 도전적인 실제 이미지 데이터셋에서 기존 방법들과 비교해 뚜렷한 향상을 이룬다.

ABSTRACT

Analyzing Pap cytology slides is an important tasks in detecting and grading precancerous and cancerous cervical cancer stages. Processing cytology images usually involve segmenting nuclei and overlapping cells. We introduce a cervical cytology dataset that can be used to evaluate nucleus detection, as well as image classification methods in the cytology image processing area. This dataset contains 93 real image stacks with their grade labels and manually annotated nuclei within images. We also present two methods: a baseline method based on a previously proposed approach, and a deep learning method, and compare their results with other state-of-the-art methods. Both the baseline method and the deep learning method outperform other state-of-the-art methods by significant margins. Along with the dataset, we publicly make the evaluation code and the baseline method available to download for further benchmarking.

연구 동기 및 목표

핵 검출 및 분할에 대한 평가를 위한 종합적이고 실제적인 데이터셋의 부족을 해결하기 위해.
일상 임상 세포학 영상의 다양성과 복잡성을 반영하는 새로운 데이터셋을 개발하고 벤치마킹하기 위해.
기존 최고 성능 방법들을 능가하는 핵 검출을 위한 기준 방법과 딥러닝 접근법을 제안하고 평가하기 위해.
세포핵의 형태학적 및 입체학적 매개변수 기반으로 자동 세포학 영상 분류 연구를 위한 토대를 마련하기 위해.
향후 세포질과 핵 경계 주석 처리를 포함하여 전체 세포 분할 평가를 지원하기 위한 기반을 마련하기 위해.

제안 방법

데이터셋은 하드웨어-소프트웨어 현미경 시스템을 사용한 체계적-무작위 방법으로 확보한 93개의 실제 확장 심도 영역(EDF) 영상에서 유래한 것으로, ThinPrep 파프염색 슬라이드에서 촬영되었다.
각 이미지 스택에는 40배 확대율에서 10~20개의 프레임이 포함되어 있으며, EDF 재구성 기법을 적용하여 각 슬라이드당 한 장의 초점이 맞춘 영상으로 생성된다.
세포핵은 세포기술사가 수작업으로 주석 처리하였으며, 각 핵의 중심에 점을 표시하였고, 핵의 최소 절반 이상이 프레임 내에 포함되고 중심점이 경계에서 최소 10 픽셀 이상 떨어져 있도록 보장하였다.
학습/테스트 분할을 생성하였으며, 각 등급 카테고리(N, LSIL, HSIL)에서 약 25%의 프레임을 테스트 세트로 할당하였고, 레이블은 CSV 파일에 저장되었다.
이전에 발표된 방법을 기반으로 한 기준 방법을 구현하고 평가하였으며, 세포핵 검출을 위해 형태학적 및 강도 기반 특징을 사용하였다.
동일한 학습 및 테스트 분할을 사용하여 컨volutional 신경망(CNN)을 학습하고 테스트하였으며, 정밀도, 재현도, F1-스코어를 사용하여 성능을 평가하였다.

실험 결과

연구 질문

RQ1기존의 핵 검출 방법 성능이 실제 세계적이고 높은 다양성을 지닌 자궁경부 세포학 데이터셋에 어떻게 일반화되는가?
RQ2더 현실적인 영상 변동성과 더 많은 주석 처리된 핵을 포함한 새로운 데이터셋이 핵 검출 알고리즘의 벤치마킹을 어떻게 향상시킬 수 있는가?
RQ3딥러닝 접근법이 이 새로운 데이터셋에서 기존의 수작업 특징 기반 방법보다 얼마나 뛰어나게 성능을 내는가?
RQ4정밀도와 재현도가 실제 세포학 영상에서 다양한 파프 검사 등급(Negative, LSIL, HSIL) 간에 어떻게 달라지는가?
RQ5영상 변동성과 겹치는 핵의 영향이 핵 검출 모델의 성능에 어떤 영향을 미치는가?

주요 결과

제안된 CNN 방법은 F1-스코어 0.878을 기록하여 기준 방법(F1 = 0.820)과 모든 다른 최고 성능 방법들을 뛰어넘었다.
기준 방법은 정밀도 0.803과 재현도 0.838을 기록하였으며, ISBI 2014 및 2015 챌린지에서 보고된 Lu 등과 Ushizima 등의 방법보다 뛰어났다.
Phoulady 등[13]의 방법은 F1-스코어 0.734를 기록하였으며, 이는 기준 방법과 CNN보다 낮아 이 더 복잡한 데이터셋에 대한 일반화 능력이 떨어지는 것으로 나타났다.
CNN 모델은 약 10%의 핵을 놓쳤으며, 주로 겹치는 핵이나 영상 경계 근처의 핵으로 인해 발생하여 고도화된 후처리 기법을 통해 향상 가능성을 시사한다.
이전의 ISBI 데이터셋과 비교해 볼 때, 이 데이터셋은 훨씬 더 도전적인 것으로 밝혀졌으며, 이는 이전 최고 성능 방법들의 성능 저하로 입증되었다.
결과적으로, 실제 영상의 변동성과 임상 샘플에서의 복잡한 핵 형태학적 특징이 이전의 합성 또는 낮은 변동성 데이터셋을 사용한 벤치마크보다 더 큰 도전 과제임을 입증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.