QUICK REVIEW

[論文レビュー] CAMEL: A Weakly Supervised Learning Framework for Histopathology Image Segmentation

Gang Xu, Zhigang Song|arXiv (Cornell University)|Aug 28, 2019

AI in cancer detection参考文献 23被引用数 23

ひとこと要約

CAMEL は、画像レベルのラベルのみを用いて、複合多重インスタンス学習（cMIL）アプローチにより高品質なインスタンスレベルラベルを自動生成することで、ヒストパスロジー画像セグメンテーションの弱教師あり学習フレームワークである。CAMELYON16 および結腸腺腫瘍データセットにおいて、完全教師あり手法と同等のセグメンテーション性能を達成し、手動によるアノテーションなしに自動ラベル拡張が有効であることを示している。

ABSTRACT

Histopathology image analysis plays a critical role in cancer diagnosis and treatment. To automatically segment the cancerous regions, fully supervised segmentation algorithms require labor-intensive and time-consuming labeling at the pixel level. In this research, we propose CAMEL, a weakly supervised learning framework for histopathology image segmentation using only image-level labels. Using multiple instance learning (MIL)-based label enrichment, CAMEL splits the image into latticed instances and automatically generates instance-level labels. After label enrichment, the instance-level labels are further assigned to the corresponding pixels, producing the approximate pixel-level labels and making fully supervised training of segmentation models possible. CAMEL achieves comparable performance with the fully supervised approaches in both instance-level classification and pixel-level segmentation on CAMELYON16 and a colorectal adenoma dataset. Moreover, the generality of the automatic labeling methodology may benefit future weakly supervised learning studies for histopathology image analysis.

研究の動機と目的

ヒストパスロジー画像セグメンテーションにおける高コストなピクセルレベルのアノテーションに依存しないように、画像レベルのラベルのみを活用すること。
人為的なバウンディングボックスやスクリッチを用いずに、画像レベルラベルからインスタンスレベルラベルへの自動的拡張手法を開発すること。
自動的に生成された近似ピクセルレベルラベルを用いて、完全教師あり学習のセグメンテーションモデルを訓練できること。
ラベル拡張手法の一般化性能を、異なるヒストパスロジーデータセットおよびタスクにおいて評価すること。
今後の研究を支援するため、新しい結腸腺腫瘍データセットを公開すること。

提案手法

CAMEL は、全スライド画像（WSI）を均一なサイズの格子状のインスタンスに分割し、インスタンスレベルの解析を可能にする。
Max-Max および Max-Min インスタンス選択基準を統合した複合多重インスタンス学習（cMIL）アプローチを採用し、データ分布のバランスとラベル品質の向上を図る。
構築されたインスタンスレベルデータセット上で cMIL モデルを訓練し、画像レベルの監視からインスタンスレベルラベルを予測する。
その後、インスタンスレベルラベルを対応するピクセルに直接割り当て、セグメンテーション学習用の近似ピクセルレベルマスクを形成する。
モデルの一般化性能を向上させるために、段階的なデータ拡張戦略を適用する。
フレームワークにより、DeepLabv2 や U-Net などのセグメンテーションモデルを、拡張されたピクセルレベルラベルを用いてエンドツーエンドで訓練可能となる。

実験結果

リサーチクエスチョン

RQ1画像レベルラベルのみを用いた弱教師ありフレームワークが、完全教師ありモデルと同等のセグメンテーション性能を達成できるか？
RQ2画像レベルラベルから自動的に生成されたインスタンスレベルラベルが、既存の弱教師あり手法を上回る性能を示せるか？
RQ3自動的に生成されたインスタンスレベルラベルの品質が、下流のピクセルレベルセグメンテーション性能にどのように影響するか？
RQ4cMILに基づくラベル拡張手法は、異なるヒストパスロジーデータセットおよびがん種に一般化できるか？
RQ5提案されたラベル拡張戦略により、過剰ラベリングを低減しつつ高いセグメンテーション精度を維持できるか？

主な発見

CAMELYON16 データセットでは、CAMEL がピクセルレベルの F1 スコア 91.8% および IoU 84.8% を達成し、完全教師ありベースライン（FSB）と同等の性能を示した。
160×160 のインスタンスサイズを用いた CAMEL は、インスタンスレベル分類で感度 94.7%、特異度 94.1% を達成し、画像レベル FSB や他の弱教師あり手法を上回った。
結腸腺腫瘍データセットでは、CAMEL がピクセルレベルの F1 スコア 89.7%（160×160）および 86.1%（320×320）を達成し、完全教師ありベースラインの 87.5% に近く、ほぼ同等の性能を示した。
より細かいインスタンスサイズ（例：160×160）を用いることで過剰ラベリングが軽減され、セグメンテーション品質が向上した。これは、ラベル生成における高解像度化の利点を示している。
CAMEL は、WILDCAT や DWS-MIL、CDWS-MIL などの最先端の弱教師あり手法を、インスタンスレベル分類およびピクセルレベルセグメンテーションの両方で上回った。
フレームワークのラベル拡張戦略は、新しい結腸腺腫瘍データセットに対しても良好に一般化され、異なるヒストパスロジータスク間での強度と移行性を確認した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。