QUICK REVIEW

[논문 리뷰] Multi-Feature Semi-Supervised Learning for COVID-19 Diagnosis from Chest X-ray Images

Qi Xiao, John L. Nosher|arXiv (Cornell University)|2021. 04. 04.

COVID-19 diagnosis using AI참고 문헌 32인용 수 7

한 줄 요약

이 논문은 흉부 X선(CXR) 영상에서 코로나19 진단을 위한 다중특징 준지도학습(SSL) 프레임워크를 제안한다. 국소위상 특징(LwPA, LPE, ELEA)을 다중채널 입력으로 통합하여 표현 학습을 향상시킨다. 학습에 단지 7.06%의 레이블된 데이터와 16.48%의 레이블되지 않은 데이터만 사용하여, 대규모 70.93% 테스트 세트에서 평균 정확도 93.61%를 달성하였으며, 이는 지도학습 및 이전의 SSL 방법들을 모두 능가한다.

ABSTRACT

Computed tomography (CT) and chest X-ray (CXR) have been the two dominant imaging modalities deployed for improved management of Coronavirus disease 2019 (COVID-19). Due to faster imaging, less radiation exposure, and being cost-effective CXR is preferred over CT. However, the interpretation of CXR images, compared to CT, is more challenging due to low image resolution and COVID-19 image features being similar to regular pneumonia. Computer-aided diagnosis via deep learning has been investigated to help mitigate these problems and help clinicians during the decision-making process. The requirement for a large amount of labeled data is one of the major problems of deep learning methods when deployed in the medical domain. To provide a solution to this, in this work, we propose a semi-supervised learning (SSL) approach using minimal data for training. We integrate local-phase CXR image features into a multi-feature convolutional neural network architecture where the training of SSL method is obtained with a teacher/student paradigm. Quantitative evaluation is performed on 8,851 normal (healthy), 6,045 pneumonia, and 3,795 COVID-19 CXR scans. By only using 7.06% labeled and 16.48% unlabeled data for training, 5.53% for validation, our method achieves 93.61\% mean accuracy on a large-scale (70.93%) test data. We provide comparison results against fully supervised and SSL methods. Code: https://github.com/endiqq/Multi-Feature-Semi-Supervised-Learning-for-COVID-19-CXR-Images

연구 동기 및 목표

딥러닝을 통한 코로나19 진단에서 레이블된 의료 데이터가 부족한 문제를 해결한다.
국소위상 영상 특징을 활용하여 표현 학습을 향상시켜 CXR 영상의 분류 성능을 향상시킨다.
의료 영상에서 대량의 레이블된 데이터에 의존하는 것을 줄이기 위해 준지도학습 프레임워크를 개발한다.
다양한 환자 인구군을 포함한 대규모 실세계 CXR 데이터셋에서 방법을 평가한다.

제안 방법

밴드패스 퀼리티 필터와 L1 정규화를 사용하여 국소가중평균위상각(LwPA), LwPA가중 국소위상에너지(LPE), 향상된 국소에너지감쇠(ELEA)라는 세 가지 국소위상 특징을 추출한다.
세 가지 국소위상 특징을 결합하여 신경망의 다중채널 다중특징(MF) 영상 입력으로 사용한다.
선생/학생 준지도학습 파이프라인을 구현하여, 선생 모델은 레이블된 데이터로 학습하고, 레이블되지 않은 데이터의 의사라벨을 생성한다.
일致성 정규화와 신뢰도 기반 필터링을 적용하여 의사라벨 데이터를 정밀하게 다듬고 학생 모델의 일반화 성능을 향상시킨다.
원본 CXR 영상과 다중특징 MF 영상을 모두 처리하기 위해 공유 가중치를 가진 다중스트림 컨volution 신경망(CNN) 아키텍처를 사용한다.
조기 정지와 학습률 감소를 적용하여, 레이블된 데이터와 고신뢰도 의사라벨 데이터의 조합을 최적화한다.

실험 결과

연구 질문

RQ1국소위상 특징은 CXR 영상에서 코로나19를 분류하는 준지도학습 모델의 성능을 향상시킬 수 있는가?
RQ2원본 CXR + 국소위상 특징의 다중특징 표현 통합은 최소한의 레이블된 데이터로 모델의 일반화 성능에 어떤 영향을 미치는가?
RQ3제안된 선생/학생 SSL 프레임워크는 훈련 데이터가 극히 제한된 상황에서 기존의 SSL 및 완전 지도학습 기반선과 비교해 뛰어난 성능을 보일 수 있는가?
RQ4모델은 다양한 환자 인구군과 영상 조건에서의 분포 이탈에 대해 얼마나 강건한가?

주요 결과

제안된 MF-TS 모델은 훈련에 단지 7.06%의 레이블된 데이터와 16.48%의 레이블되지 않은 데이터만 사용하여, 대규모 테스트 세트(전체 데이터의 70.93%)에서 평균 정확도 93.61%를 달성하였다.
레이블된 데이터가 10% 이하(전체 데이터의 2.35%)일 경우, MF-TS 모델은 Test-1에서 평균 정확도 92.43%를 기록하였으며, ResNet50(86.46%) 및 다른 SSL 기반선보다 뚜렷이 뛰어난 성능을 보였다.
MF-TS 모델은 데이터셋 간에 뛰어난 안정성을 보였으며, Test-1과 Test-2 간 평균 정확도 감소율이 1.69%에 불과했고, 의사라벨링 기반 방법은 8.58%의 감소율을 보였다.
다중특징 접근법(MF-TS)은 기준 CXR-TS(Billion-Scale) 대비 Test-2에서 1.22% 향상되고 Test-1에서 1.18% 향상되어 특징 융합의 유용성을 입증하였다.
제거 실험을 통해 국소위상 특징이 모델 성능을 크게 향상시키는 것으로 확인되었으며, MF-TS는 단일특징 변형인 Enh-TS 및 MF-T보다 뛰어난 성능을 보였다.
이 방법은 코로나19 CXR 분류에 대해 보고된 바 있는 가장 큰 규모의 SSL 평가에서 최고 성능을 달성하였으며, 극히 적은 레이블된 데이터만을 사용하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.