QUICK REVIEW

[논문 리뷰] A large annotated medical image dataset for the development and evaluation of segmentation algorithms

Amber L. Simpson, Michela Antonelli|arXiv (Cornell University)|2019. 02. 25.

COVID-19 diagnosis using AI참고 문헌 27인용 수 717

한 줄 요약

이 논문은 일반 목적 세그멘테이션 방법의 벤치마크를 위해 CC-BY-SA 4.0 하에 공개되고 10개의 주석 달린 의료 영상 데이터셋으로 구성된 크고 개방적이며 다기관 컬렉션을 제시한다. 2018년 Medical Segmentation Decathlon 대회에 사용되어 벤치마크를 수행했다.

ABSTRACT

Semantic segmentation of medical images aims to associate a pixel with a label in a medical image without human initialization. The success of semantic segmentation algorithms is contingent on the availability of high-quality imaging data with corresponding labels provided by experts. We sought to create a large collection of annotated medical image datasets of various clinically relevant anatomies available under open source license to facilitate the development of semantic segmentation algorithms. Such a resource would allow: 1) objective assessment of general-purpose segmentation methods through comprehensive benchmarking and 2) open and free access to medical image data for any researcher interested in the problem domain. Through a multi-institutional effort, we generated a large, curated dataset representative of several highly variable segmentation tasks that was used in a crowd-sourced challenge - the Medical Segmentation Decathlon held during the 2018 Medical Image Computing and Computer Aided Interventions Conference in Granada, Spain. Here, we describe these ten labeled image datasets so that these data may be effectively reused by the research community.

연구 동기 및 목표

일반 목적의 세그멘테이션 방법에 대한 객관적 벤치마킹을 가능하게 하기 위해 여러 해부학에 걸친 대규모 오픈 소스 주석 의료 영상 컬렉션을 생성한다.
비식별 처리되고 재형식화된 데이터를 비전문가도 사용할 수 있는 공통 형식으로 제공함으로써 의료 영상 데이터에 대한 접근을 민주화한다.
MICCAI 2018 기간 동안 크라우드소싱 도전 과제(MSD)를 통해 다양한 과제에 걸친 알고리즘 일반화 가능성 평가를 촉진한다.
세그멘테이션 연구의 재사용성과 재현성을 지원하기 위해 표준화된 데이터 설명자와 인프라를 제공한다.

제안 방법

현실 세계의 변이를 반영하기 위해 여러 해부학, 모달리티, 기관에서 2,633개의 3D 이미지를 수집했다.
기여 기관의 IRB 정책에 따라 데이터의 비식별화를 수행했다.
전용 소프트웨어 의존성을 제거하기 위해 모든 이미지를 NIfTI 형식으로 재형식화했다.
MSD 도전을 위한 JSON 설명자와 학습/테스트 분할이 포함된 ten labeled 데이터셋을 제공했다.
좌표 프레임을 일관된 Right-Anterior-Superior(RAS) 공간으로 수동으로 확인하고 수정했다.
활용 및 저작자 표시 지침과 함께 Creative Commons CC-BY-SA 4.0 하에 데이터를 공개했다.

실험 결과

연구 질문

RQ1단일의 크고 개방된 데이터셋이 다양한 과제에 걸쳐 일반 목적 세그멘테이션 알고리즘의 객관적 벤치마킹을 가능하게 할 수 있는가?
RQ2다기관, 다모달 데이터가 세그멘테이션 방법의 개발 및 평가에 어떤 영향을 미치는가?
RQ3의료 영상 전문가 외 연구자들이 재사용을 촉진하는 표준화된 설명자와 형식을 제공하는 것이 가능한가?
RQ4크라우드소싱 도전(MSD)이 세그멘테이션 알고리즘의 일반화 가능성을 측정하는 데 어떤 가능성이 있는가?
RQ5획득 프로토콜의 실제 세계 변동이 세그멘테이션 성능과 벤치마킹에 어떤 영향을 미치는가?

주요 결과

MSD 데이터세트는 뇌, 심장, 간, 해마, 전립선, 폐, 췌장, 간 혈관, 비장, 결장의 분할을 나타내는 2,633개의 3D 이미지를 포함한 열 가지 과제로 구성된다.
모든 데이터는 NIfTI로 재형식화되고 JSON 설명자로 설명되어 일반 도구(예: 3D Slicer, ITK-Snap, MATLAB)로 쉽게 사용할 수 있다.
데이터는 비식별화되어 재사용 극대화를 위해 CC-BY-SA 4.0 하에 공유되며 출처 표기가 보존된다.
해당 자원은 2018년 Medical Segmentation Decathlon 도전에서 다양한 과제에 걸친 일반 목적 세그멘테이션 방법을 벤치마킹하는 데 적극 활용되었다.
데이터세트는 다수의 기관에 걸친 실질적인 획득 및 재구성 변동을 반영하여 현실적인 임상 영상 시나리오를 나타낸다.
사용 예시 주석은 방향 일관성(RAS)과 데이터 무결성을 유지하기 위한 비정량 크기의 처리에 중점을 둔다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.