Skip to main content
QUICK REVIEW

[論文レビュー] From Cold Start to Active Learning: Embedding-Based Scan Selection for Medical Image Segmentation

Devon Levy, Bar Assayag|arXiv (Cornell University)|Jan 26, 2026
Advanced Neural Network Applications被引用数 0
ひとこと要約

この論文は、まず foundation-model の埋め込みとクラスタリングを用いて多様なコールドスタート学習セットを作成し、次に不確実性と多様性を組み合わせたアクティブラーニング戦略で医用画像分割の追加ラベルを取得する2段階フレームワークを提案する。低データ領域でX線とMRIデータセットにおいてDiceとHausdorff距離の一貫した改善を報告する。

ABSTRACT

Accurate segmentation annotations are critical for disease monitoring, yet manual labeling remains a major bottleneck due to the time and expertise required. Active learning (AL) alleviates this burden by prioritizing informative samples for annotation, typically through a diversity-based cold-start phase followed by uncertainty-driven selection. We propose a novel cold-start sampling strategy that combines foundation-model embeddings with clustering, including automatic selection of the number of clusters and proportional sampling across clusters, to construct a diverse and representative initial training. This is followed by an uncertainty-based AL framework that integrates spatial diversity to guide sample selection. The proposed method is intuitive and interpretable, enabling visualization of the feature-space distribution of candidate samples. We evaluate our approach on three datasets spanning X-ray and MRI modalities. On the CheXmask dataset, the cold-start strategy outperforms random selection, improving Dice from 0.918 to 0.929 and reducing the Hausdorff distance from 32.41 to 27.66 mm. In the AL setting, combined entropy and diversity selection improves Dice from 0.919 to 0.939 and reduces the Hausdorff distance from 30.10 to 19.16 mm. On the Montgomery dataset, cold-start gains are substantial, with Dice improving from 0.928 to 0.950 and Hausdorff distance decreasing from 14.22 to 9.38 mm. On the SynthStrip dataset, cold-start selection slightly affects Dice but reduces the Hausdorff distance from 9.43 to 8.69 mm, while active learning improves Dice from 0.816 to 0.826 and reduces the Hausdorff distance from 7.76 to 6.38 mm. Overall, the proposed framework consistently outperforms baseline methods in low-data regimes, improving segmentation accuracy.

研究の動機と目的

  • ラベリングコストと専門知識の制約を考慮したラベル効率の良い医用画像分割を動機づける。
  • 多様なコールドスタート初期化と不確実性を意識したアクティブラーニングを組み合わせた2段階フレームワークを提案する。
  • 低次元の特徴空間でサンプリング過程を直感的に可視化できるようにする。
  • 低ラベリング予算の下で複数データセットで分割性能を向上させることを示す。

提案手法

  • 医用画像から foundation-model の埋め込みを抽出し、視覚化と距離計算のために2Dへt-SNEで射影する。
  • 複数の候補k値を用いて2D埋め込み上でk-meansクラスタリングを実施し、平均シルエットスコアを最大化する設定を選択する。
  • クラスターの重心を初期種子として選択し、残りの予算をクラスタサイズに比例配分し、各クラスタ内で最も遠い点サンプリングを用いて多様性を確保する。
  • コールドスタート種子で初期分割モデルを学習し、画像レベルのエントロピーと空間的多様性スコアを組み合わせて追加サンプルを反復的に取得する。
  • ピクセルレベルのクラス確率から画像レベルのエントロピーを計算し正規化する。空間的多様性を2D埋め込みで既に選択済みサンプルからの距離として測定し、トレードオフパラメータalphaを用いて獲得スコアS(i)を得る。
  • ラベリング予算が尽きるまで最も高いS(i)を持つサンプルを反復的に選択する。
Figure 1: Framework overview: cold-start followed by active selection
Figure 1: Framework overview: cold-start followed by active selection

実験結果

リサーチクエスチョン

  • RQ1埋め込みベースのクラスタリングは、医用画像分割においてランダムサンプリングやナイーブなクラスタリングよりも多様で代表的なコールドスタートを提供するか。
  • RQ2エントロピーベースの不確実性信号と空間的多様性を組み合わせると、分割のアクティブラーニングにおけるサンプル効率は向上するか。
  • RQ3提案手法は、SynthStrip、Montgomery、CheXmask-300など、異なるデータ規模の複数のモダリティおよび臓器でどのように性能を示すか。

主な発見

  • foundation-model の埋め込みとシルエット最適化クラスタリングによるコールドスタートは、すべてのデータセットでランダム選択よりDiceを改善し、Hausdorff距離を短縮する(例: CheXmask: Dice 0.929 vs 0.918; HD 27.66 mm vs 32.41 mm)。
  • アクティブラーニング段階ではエントロピーと多様性の組み合わせがさらなる改善をもたらす(例: CheXmask-300: Dice 0.936–0.939、HD 19.16–20.0 mm、設定による)。
  • Montgomery ではコールドスタートの利得が大きく、Dice が最大0.950、HD が予算間で9.38–20.44 mmの範囲まで低下。
  • SynthStrip ではコールドスタートがDiceを穏やかに向上させつつHDを低下させる(HDは9.43から8.69 mmへ)。アクティブラーニングは Diceを0.816から0.826へ、HDを7.76から6.38 mmへ改善。
  • データセット全体で、提案手法は低データ領域で一貫してベースラインと同等または上回り、ランダムサンプリングと比較して結果のばらつきを低減する。
Figure 2: Our cold-start method. First, foundation-model embeddings are extracted and projected to 2D using t-SNE; the optimal number of clusters is then selected via silhouette-scored k-means, cluster medoids are chosen as initial seeds, and the remaining budget is filled by farthest-point sampling
Figure 2: Our cold-start method. First, foundation-model embeddings are extracted and projected to 2D using t-SNE; the optimal number of clusters is then selected via silhouette-scored k-means, cluster medoids are chosen as initial seeds, and the remaining budget is filled by farthest-point sampling

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。