Skip to main content
QUICK REVIEW

[論文レビュー] SA-Med2D-20M Dataset: Segment Anything in 2D Medical Imaging with 20 Million masks

Ye Jin, Junlong Cheng|arXiv (Cornell University)|Nov 20, 2023
COVID-19 diagnosis using AI被引用数 14
ひとこと要約

SA-Med2D-20M は 4.6 百万の画像と 19.7 百万のマスクを含む大規模な2D医用画像分割データセットで、広範なモダリティと解剖学的カバーを通じて SAM スタイルの分割に医療知識を取り入れることを目的としています。

ABSTRACT

Segment Anything Model (SAM) has achieved impressive results for natural image segmentation with input prompts such as points and bounding boxes. Its success largely owes to massive labeled training data. However, directly applying SAM to medical image segmentation cannot perform well because SAM lacks medical knowledge -- it does not use medical images for training. To incorporate medical knowledge into SAM, we introduce SA-Med2D-20M, a large-scale segmentation dataset of 2D medical images built upon numerous public and private datasets. It consists of 4.6 million 2D medical images and 19.7 million corresponding masks, covering almost the whole body and showing significant diversity. This paper describes all the datasets collected in SA-Med2D-20M and details how to process these datasets. Furthermore, comprehensive statistics of SA-Med2D-20M are presented to facilitate the better use of our dataset, which can help the researchers build medical vision foundation models or apply their models to downstream medical applications. We hope that the large scale and diversity of SA-Med2D-20M can be leveraged to develop medical artificial intelligence for enhancing diagnosis, medical image analysis, knowledge sharing, and education. The data with the redistribution license is publicly available at https://github.com/OpenGVLab/SAM-Med2D.

研究の動機と目的

  • SAM(Segment Anything Model)と医用画像診断のギャップを埋める大規模で多様な医用分割データセットを提供する。
  • 医用画像解析のための基盤モデルを訓練・適用するための広範で多モダリティな2D医用データセットを作成する。
  • 利用可能で拡張可能な分割リソースを保証するためのデータ収集、正規化、およびマスク処理パイプラインを記述する。
  • 下流の医療応用を導く研究者を支援する統計的データセットを包括的に提供する。

提案手法

  • ウェブリソース(例:TCIA、OpenNeuro、NITRC、Grand Challenge、Synapse、GitHub)から2D医用画像分割データを収集する。
  • Self-Min-Max正規化を用いてPNGへ正規化し、2D/3Dスライス処理によって次元を統一する。
  • マスクは多ラベルを二値化に変換し、連結成分を分離し、 overlaps を統合し、小領域をフィルタリングして処理する。
  • マスクカテゴリ情報をJSONファイルに記録し、画像とマスクの命名規約を統一する。
  • モダリティと解剖構造のカバレッジを考慮し、詳細な統計情報とともにリリース準備されたデータセットを提供する。

実験結果

リサーチクエスチョン

  • RQ1医療ビジョン基盤モデルを効果的に支援するには、医用画像分割データセットはどれほど大規模で多様であるべきか?
  • RQ2SAM風の分割フレームワークは、大規模・多モダリティの2D医用画像データセットから恩恵を受けられるか?
  • RQ3異種の医療データセットを分割タスク用に標準化するには、どのようなデータ処理手順が必要か?

主な発見

  • SA-Med2D-20M は 4.6 百万の2D医用画像と 19.7 百万のマスクから構成される。
  • データセットは10モダリティ、31の主要臓器、271のラベルクラスを、200を超えるカテゴリにまたがってカバーする。
  • CTおよびMRモダリティが、画像とマスクの収集の両方で支配的である。
  • マスクは二値の成分に処理され、小さなターゲットを除外し、一貫した形式に揃えられている。
  • データの統計は長尾のラベル分布を示し、1000マスク未満のカテゴリが多く、100k–1Mの範囲には47カテゴリがある。
  • データは PNG へ正規化され、カテゴリマッピングを含む JSON レコードとともに再現可能な研究を支援する構成となっている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。