Skip to main content
QUICK REVIEW

[논문 리뷰] Weakly Supervised Medical Diagnosis and Localization from Multiple Resolutions

Yao Li, Jordan Prosky|arXiv (Cornell University)|2018. 03. 21.
COVID-19 diagnosis using AI참고 문헌 32인용 수 97
한 줄 요약

논문은 이미지 레벨 라벨만으로 흉부 X-선 영상의 이상을 진단하고 위치를 학습하는 다해상도 약지도 학습 프레임워크를 제시하며, 적응 가능한 주목도 맵을 위한 새로운 LSE-LBA 풀링을 도입한다.

ABSTRACT

Diagnostic imaging often requires the simultaneous identification of a multitude of findings of varied size and appearance. Beyond global indication of said findings, the prediction and display of localization information improves trust in and understanding of results when augmenting clinical workflow. Medical training data rarely includes more than global image-level labels as segmentations are time-consuming and expensive to collect. We introduce an approach to managing these practical constraints by applying a novel architecture which learns at multiple resolutions while generating saliency maps with weak supervision. Further, we parameterize the Log-Sum-Exp pooling function with a learnable lower-bounded adaptation (LSE-LBA) to build in a sharpness prior and better handle localizing abnormalities of different sizes using only image-level labels. Applying this approach to interpreting chest x-rays, we set the state of the art on 9 abnormalities in the NIH's CXR14 dataset while generating saliency maps with the highest resolution to date.

연구 동기 및 목표

  • 다양한 크기의 흉부 X-선 소견의 로컬라이제이션 향상을 위해 다해상도 분석을 활용하는 동기를 제시한다.
  • ROI 주석 없이도 고해상도 주의 맵을 생성하는 약지도 프레임워크를 개발한다.
  • 다양한 병변 크기를 다루기 위한 학습 가능한 Log-Sum-Exp 풀링과 하한-적응(LSE-LBA)을 도입한다.
  • NIH Chest X-ray(CXR14) 데이터셋에서 최첨단 분류 및 로컬라이제이션을 입증한다.

제안 방법

  • 고해상도와 저해상도의 특징을 dense 연결로 융합하는 다해상도 아키텍처를 제안한다. - ResNet 블록으로 공간 해상도를 축소하고 DenseNet 스타일의 연결로 해상도를 유지한다. - 해상도를 넘나들며 특징을 반복적으로 업샘플링하고 연결하여 로컬라이제이션을 위한 거친-정밀 표현을 형성한다.
  • 이미지 레벨 라벨이 2D 주목도 맵에서 인스턴스별 예측을 감독하는 약지도 MIL 프레임워크를 사용한다.
  • LSE-LBA 풀링을 도입: p = (1/(r0+exp(beta))) * log( (1/wh) * sum exp[(r0+exp(beta)) * S_ij] ), with r = r0 + exp(beta) 제공하는 학습 가능한, 하한이 있는 샤프니스 프라이어.
  • WI_n(x)에 시그모이드(Sigmoid)를 적용하여 인스턴스별 클래스 확률을 얻은 뒤 LSE-LBA를 통해 풀링하여 이미지 수준 예측을 얻고 다중 레이블 교차 엔트로피로 학습한다.
  • 표준 데이터 증강 및 Adam 최적화를 사용하여 NIH Chest X-ray 데이터셋에서 처음부터 학습; 각 이상 여부에 대한 AUC와 위치지정을 위한 연속 Dice를 사용하여 평가한다.

실험 결과

연구 질문

  • RQ1다중해상도, 약지도 학습으로도 흉부 X-선에서 이미지 수준 라벨만으로도 병리학 위치를 정확히 로컬라이즈할 수 있는가?
  • RQ2LSE-LBA 풀링은 서로 다른 크기의 이상에 대해 강건하고 고해상도 주의 맵을 제공하는가?
  • RQ3다중해상도 융합이 NIH CXR14에서 분류 성능(AUC)과 위치 정확도(Dice)에 어떤 영향을 미치는가?
  • RQ4다양한 병리에서 로컬라이제이션과 분류에 대한 r0의 샤프니스 프라이어가 미치는 영향은 무엇인가?

주요 결과

  • NIH Chest X-ray 테스트 세트에서 대부분의 경우 ImageNet 사전 학습 없이 14개 이상 중 9개 이상 병변에서 최첨단 혹 경쟁력 있는 AUC를 달성한다.
  • r0가 증가할수록 국소적 및 확산 이상 모두에 대해 고해상도 확률적 주의 맵을 생성하여 로컬라이제이션이 향상됨을 보여준다.
  • 로컬라이제이션 성능(Dice)은 보통 중간 수준의 샤프니스 프라이어(r0가 약 5일 때)에서 향상되며 확산 병변에서 매우 큰 r0일 때는 악화될 수 있다.
  • 분류 성능은 r0에 강건하고, 로컬라이제이션은 r0에 더 민감하며 샤프니스와 커버리지의 균형에서 최상의 결과를 보인다.
  • 추가 라벨링 데이터 없이도 여러 병변에서 기존의 약지도 방식보다 우수하며 다른 방법에 근접하거나 이를 능가하는 경우가 많다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.