Skip to main content
QUICK REVIEW

[論文レビュー] InstanSeg: an embedding-based instance segmentation algorithm optimized for accurate, efficient and portable cell segmentation

Thibaut Goldsborough, Ben Philps|arXiv (Cornell University)|Aug 28, 2024
AI in cancer detection被引用数 7
ひとこと要約

InstanSeg は埋め込みベースのインスタンスセグメンテーションパイプラインで、細胞/核のセグメンテーションにおいて高い精度と著しく高速な推論を実現し、TorchScript のシリアライズと簡易統合のための QuPath 拡張を備える。

ABSTRACT

Cell and nucleus segmentation are fundamental tasks for quantitative bioimage analysis. Despite progress in recent years, biologists and other domain experts still require novel algorithms to handle increasingly large and complex real-world datasets. These algorithms must not only achieve state-of-the-art accuracy, but also be optimized for efficiency, portability and user-friendliness. Here, we introduce InstanSeg: a novel embedding-based instance segmentation pipeline designed to identify cells and nuclei in microscopy images. Using six public cell segmentation datasets, we demonstrate that InstanSeg can significantly improve accuracy when compared to the most widely used alternative methods, while reducing the processing time by at least 60%. Furthermore, InstanSeg is designed to be fully serializable as TorchScript and supports GPU acceleration on a range of hardware. We provide an open-source implementation of InstanSeg in Python, in addition to a user-friendly, interactive QuPath extension for inference written in Java. Our code and pre-trained models are available at https://github.com/instanseg/instanseg .

研究の動機と目的

  • diverse microscopy datasets.
  • 高い精度と効率を大型・実世界のバイオメドデータセットで実現する。
  • TorchScript でのシリアライズと横断言語統合(QuPath 拡張)を通じてポータビリティと使いやすさを高める。
  • 既存の生物画像ワークフローへ統合可能なEnd-to-end、GPU加速、非独自プロプライエタリなパイプラインを提供する。

提案手法

  • 改良された UNet バックボーンを用いたEmbedベースのセグメンテーション。
  • Seedベースのピクセル割り当て:seed map、位置埋め込み、条件付き埋め込みを予測。
  • ピクセルオフセットと埋め込みを用いるニューラルネットヘッド Phi によるInstance確率マッピング。
  • 損失関数の組み合わせで訓練:seed loss Ls(インスタンス境界までの距離)と instance loss Li(Lovasz hinge with one-vs-rest labeling)。
  • 推論は局所最大値でシードをサンプリングし、オフセット Qij−Qk を計算し、IoUベースの結合で重複するインスタンス予測を統合。
Figure 1: The InstanSeg pipeline. A feature encoder $f$ and three feature heads $s,p$ and $e$ transform an input image $\bm{X}$ into a seed map $\bm{S}$ , a positional embedding $\bm{P}$ and a conditional embedding $\bm{E}$ . We sample local maxima in the seed map to find the coordinates of seed pix
Figure 1: The InstanSeg pipeline. A feature encoder $f$ and three feature heads $s,p$ and $e$ transform an input image $\bm{X}$ into a seed map $\bm{S}$ , a positional embedding $\bm{P}$ and a conditional embedding $\bm{E}$ . We sample local maxima in the seed map to find the coordinates of seed pix

実験結果

リサーチクエスチョン

  • RQ1学習済みシード伝播を伴う埋め込みベースのアプローチは、多様な核データセットで最先端の精度を達成できるのか。
  • RQ2シード中心のニューラルクラスタリングアプローチは、接触・重なり核のセグメンテーションを改善しつつ、効率性とポータビリティを維持できるのか。
  • RQ3InstanSeg は標準ハードウェア、特にGPU制限環境での推論速度とメモリ使用量においてどう性能を示すのか。
  • RQ4方法を非Pythonツールへ(TorchScript)シリアライズし、GUIワークフロー(QuPath 拡張)へ統合しても性能を犠牲にしないのか。
  • RQ5より高次元の位置情報/条件付き埋め込みを使用することがセグメンテーション精度に与える影響は何か。

主な発見

DatasetStarDist F1_muStarDist F1_0.5HoVer-Net F1_muHoVer-Net F1_0.5CellPose F1_muCellPose F1_0.5EmbedSeg F1_muEmbedSeg F1_0.5InstanSeg F1_muInstanSeg F1_0.5InstanSeg F1_mu (TTA)InstanSeg F1_0.5 (TTA)
TNBC 20180.6450.8960.5460.7680.6270.8350.6410.8700.6990.8980.7040.899
NuInsSeg0.4940.7990.3740.6350.4970.7880.4920.7610.5110.7870.5270.805
MoNuSeg0.5430.8460.4380.7070.5530.850--0.5750.8610.5660.860
IHC TMA0.4700.7980.3040.5590.5450.811--0.5600.8360.5730.834
CoNSeP0.4180.6900.3120.5380.3890.626--0.4830.7060.4910.709
LyNSeC0.7010.9200.6590.8860.7010.911--0.7240.9230.7250.922
  • InstanSegは6つの公開核データセットで最先端または競合的な精度を達成し、ベースラインをしばしば上回る。
  • 推論はベースラインより大幅に高速で、ノートパソコンのGPU上で199画像、36,073インスタンスを含む場合の総推論約9.4秒、後処理時間はEmbedSegより著しく低い。
  • TorchScriptでシリアライズされたモデルとQuPath拡張により、AppleおよびNVIDIAハードウェアでのGPU加速を含むポータブルで多言語対応の利用が可能。
  • 高次元の位置埋め込み(De > 2)を追加し、条件付き埋め込み(De > 0)を含める Ablation で精度向上を示す;これらの要素を除去すると性能が劣化。
  • データセットを横断して、InstanSeg は一貫して StarDist、HoVer-Net、CellPose、EmbedSeg を F1 指標で上回り、TTA はほとんどのケースでさらなる利得を提供。
Figure 2: InstanSeg uses a local maxima algorithm on a predicted seed map (left image) to locate suitable seed(s) for each object. In large instances, there may be multiple seeds detected within the object. InstanSeg was trained to predict the full instance irrespective of the sampled seed location,
Figure 2: InstanSeg uses a local maxima algorithm on a predicted seed map (left image) to locate suitable seed(s) for each object. In large instances, there may be multiple seeds detected within the object. InstanSeg was trained to predict the full instance irrespective of the sampled seed location,

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。