QUICK REVIEW

[論文レビュー] Suggestive Annotation: A Deep Active Learning Framework for Biomedical Image Segmentation

Lin Yang, Yizhe Zhang|arXiv (Cornell University)|Jun 15, 2017

Machine Learning and Algorithms参考文献 14被引用数 34

ひとこと要約

本論文は、予測の不確実性と類似性を統合した一般化最大集合被覆定式化を用いて、最も情報量の多い領域を自動で特定することで、生物学的画像分類におけるアノテーション作業を削減する深層アドティブラーニングフレームワークを提案する。2つのベンチマークデータセットにおいて、訓練データの50%のみを用いても最先端の分類性能を達成している。

ABSTRACT

Image segmentation is a fundamental problem in biomedical image analysis. Recent advances in deep learning have achieved promising results on many biomedical image segmentation benchmarks. However, due to large variations in biomedical images (different modalities, image settings, objects, noise, etc), to utilize deep learning on a new application, it usually needs a new set of training data. This can incur a great deal of annotation effort and cost, because only biomedical experts can annotate effectively, and often there are too many instances in images (e.g., cells) to annotate. In this paper, we aim to address the following question: With limited effort (e.g., time) for annotation, what instances should be annotated in order to attain the best performance? We present a deep active learning framework that combines fully convolutional network (FCN) and active learning to significantly reduce annotation effort by making judicious suggestions on the most effective annotation areas. We utilize uncertainty and similarity information provided by FCN and formulate a generalized version of the maximum set cover problem to determine the most representative and uncertain areas for annotation. Extensive experiments using the 2015 MICCAI Gland Challenge dataset and a lymph node ultrasound image segmentation dataset show that, using annotation suggestions by our method, state-of-the-art segmentation performance can be achieved by using only 50% of training data.

研究の動機と目的

専門家しかラベル付けできない多数のインスタンス（例：細胞）が存在する生物学的画像分類における高いアノテーションコストに対処すること。
最初にラベル付けすべき最も情報量の多い画像領域を特定することで、広範な手動アノテーションの必要性を低減すること。
完全畳み込みネットワーク（FCN）とアドティブラーニングを統合した、効率的でエキスパートによるガイド付きラベリングを実現する深層アドティブラーニングフレームワークの開発。
FCNの予測から得られる不確実性と類似性を用いて一般化最大集合被覆問題を定式化することで、アノテーションの効率を向上させること。
大幅に削減された訓練データを用いても最先端の分類性能を達成し、正確性を損なわずにアノテーション作業を最小限に抑えること。

提案手法

限られたデータで良好な一般化性能を発揮するため、バッチ正規化、残差接続、ボトルネック構造を用いた、高速なトレーニングと強い一般化性能を実現する新しい完全畳み込みネットワーク（FCN）の設計。
予測の不確実性を推定するために、モンテカルロドロップアウトを用いたブートストラップ法を採用し、予測において曇りや不確実性がある領域を特定。
FCNの最終エンコーダ層からの特徴量を用いて、意味的に類似した画像をグループ化するための画像類似度を計算。
類似性（多様性）と不確実性（情報量）の両方をバランスさせる一般化最大集合被覆問題を定式化し、ラベル付けに最も効果的な画像を選択。
FCNを繰り返しトレーニングし、集合被覆定式化に基づいて次にラベル付けすべき画像を提示し、新たにラベル付けされたデータで再トレーニングすることで、時間経過とともに性能を向上。
一般化最大集合被覆問題に対して、1−1/eの近似比保証を持つ貪欲近似アルゴリズムを用いて、次回のラベル付けバッチを効率的に選択。

実験結果

リサーチクエスチョン

RQ1深層アドティブラーニングフレームワークは、生物学的画像分類において高い性能を維持しながら、アノテーション作業を削減できるか？
RQ2トレーニング済みのFCNから得られる不確実性と類似性の情報は、どのように効果的にアノテーション選択に統合できるか？
RQ3提案された一般化最大集合被覆定式化は、ランダム選択および不確実性のみに基づくクエリ戦略を上回る性能を示すか？
RQ4このフレームワークは、完全な訓練データの50%のみを用いても、最先端の分類性能を達成できるか？
RQ5異なる生物学的画像処理タスク、特にデータ分布やインスタンス数が異なる状況においても、このフレームワークは汎用性を示せるか？

主な発見

2015年MICCAI GlandチャレンジデータセットのPart AとPart Bにおいて、訓練データの50%のみを用いても、F1スコアがそれぞれ0.921（最先端）と0.855（最先端）を達成した。
リンパ節超音波画像分類データセットでは、訓練データの50%を用いて、平均交差率（mIoU）が0.875、F1スコアが0.871を達成し、先行研究の最先端手法を上回った。
両データセットにおいて、評価のバジェット（10%、30%、50%）にかかわらず、提示されたアノテーション提案手法は、ランダムクエリ戦略および不確実性のみのクエリ戦略を常に上回った。
ラベル付けされたピxlsの50%のみを用いても、Object Hausdorff距離がPart Aで44.736、Part Bで96.976にまで低下し、境界の正確性が向上したことを示した。
提案されたFCNアーキテクチャの高速収束性と一般化性能のおかげで、初期訓練データが極めて少ない状況でも高い性能を維持できた。
一般化最大集合被覆問題の貪欲近似により、多様で不確実性の高い画像が効率的に選択され、アノテーション作業に対する性能向上が速やかに達成された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。