Skip to main content
QUICK REVIEW

[論文レビュー] A large annotated medical image dataset for the development and evaluation of segmentation algorithms

Amber L. Simpson, Michela Antonelli|arXiv (Cornell University)|Feb 25, 2019
COVID-19 diagnosis using AI参考文献 27被引用数 717
ひとこと要約

本論文は、CC-BY-SA 4.0の下で公開され、 Medical Segmentation Decathlon 2018 チャレンジで一般目的のセグメンテーション手法を評価するために使用された、意味セグメンテーション用の多機関にまたがる大規模な注釈付き医用画像データセット10件の公開コレクションを提示します。

ABSTRACT

Semantic segmentation of medical images aims to associate a pixel with a label in a medical image without human initialization. The success of semantic segmentation algorithms is contingent on the availability of high-quality imaging data with corresponding labels provided by experts. We sought to create a large collection of annotated medical image datasets of various clinically relevant anatomies available under open source license to facilitate the development of semantic segmentation algorithms. Such a resource would allow: 1) objective assessment of general-purpose segmentation methods through comprehensive benchmarking and 2) open and free access to medical image data for any researcher interested in the problem domain. Through a multi-institutional effort, we generated a large, curated dataset representative of several highly variable segmentation tasks that was used in a crowd-sourced challenge - the Medical Segmentation Decathlon held during the 2018 Medical Image Computing and Computer Aided Interventions Conference in Granada, Spain. Here, we describe these ten labeled image datasets so that these data may be effectively reused by the research community.

研究の動機と目的

  • 複数の解剖部位にまたがる注釈付き医用画像の大規模でオープンソースのコレクションを作成し、一般目的のセグメンテーション手法の客観的ベンチマークを可能にする。
  • 医療画像データへのアクセスを非識別化・再フォーマット化した共通フォーマットで提供し、非専門家が利用できるようにする。
  • MICCAI 2018のMSDチャレンジを通じて、さまざまなタスクにわたるアルゴリズムの一般化能力の評価を促進する。
  • セグメンテーション研究の再利用性と再現性を支援する標準化データ記述とインフラストラクチャを提供する。

提案手法

  • 実世界のばらつきを反映するため、複数の解剖部位、モダリティ、施設から2,633件の三次元画像を収集した。
  • 協力施設のIRBポリシーに従ってデータを識別情報を削除した。
  • 専門ソフトウェアに依存しないよう全画像をNIfTI形式に再フォーマットした。
  • MSDチャレンジ用に10のラベル付きデータセットをJSON記述子と訓練/テスト分割とともに提供した。
  • 座標系を一貫したRight-Anterior-Superior (RAS)空間に手動で検証・修正した。
  • 使用と帰属に関するガイダンスとともに、データをCreative Commons CC-BY-SA 4.0の下で公開した。

実験結果

リサーチクエスチョン

  • RQ1多様なタスクに across させて、1つの大規模なオープンデータセットが一般目的のセグメンテーションアルゴリズムの客観的ベンチマークを実現できるか?
  • RQ2多施設・多モダリティデータは、セグメンテーション手法の開発と評価にどのような影響を与えるか?
  • RQ3医用画像専門家以外の研究者の再利用を促進する標準化記述子とフォーマットを提供することは可能か?
  • RQ4クラウドソーシング型のチャレンジ(MSD)はセグメンテーションアルゴリズムの一般化可能性を測定する可能性があるか?
  • RQ5取得プロトコルの現実世界のばらつきはセグメンテーションの性能とベンチマークにどのように影響するか?

主な発見

  • MSDデータセットはbrain、heart、liver、hippocampus、prostate、lung、pancreas、hepatic vessels、spleen、colonのセグメンテーションを表す10タスクと2,633の3D画像から成る。
  • すべてのデータはNIfTIへ再フォーマットされ、JSON記述子で記述され、一般的なツール(例:3D Slicer、ITK-Snap、MATLAB)と容易に連携可能となっている。
  • データは識別情報が削除され、再利用を最大化しつつ帰属を保護するためにCC-BY-SA 4.0の下で共有されている。
  • リソースは2018年のMedical Segmentation Decathlonチャレンジで、タスク間の一般目的のセグメンテーション手法のベンチマークに積極的に活用された。
  • データセットは複数の施設にわたる実際の臨床画像シナリオを反映する、取得および再構成のばらつきをかなり含んでいる。
  • 例示された利用ノートは、データの整合性を維持するための配向一貫性(RAS)と非定量的な大きさの扱いの強調を含む。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。