Skip to main content
QUICK REVIEW

[論文レビュー] Interventional Bag Multi-Instance Learning On Whole-Slide Pathological Images

Tiancheng Lin, Zhimiao Yu|arXiv (Cornell University)|Mar 13, 2023
AI in cancer detection被引用数 8
ひとこと要約

IBMIL は WSIs のバッグレベル MIL に対して介入的な学習段階を導入し、バックドア調整を用いてバッグの文脈的事前バイアスを緩和することで、既存の MIL 手法の性能を向上させる。

ABSTRACT

Multi-instance learning (MIL) is an effective paradigm for whole-slide pathological images (WSIs) classification to handle the gigapixel resolution and slide-level label. Prevailing MIL methods primarily focus on improving the feature extractor and aggregator. However, one deficiency of these methods is that the bag contextual prior may trick the model into capturing spurious correlations between bags and labels. This deficiency is a confounder that limits the performance of existing MIL methods. In this paper, we propose a novel scheme, Interventional Bag Multi-Instance Learning (IBMIL), to achieve deconfounded bag-level prediction. Unlike traditional likelihood-based strategies, the proposed scheme is based on the backdoor adjustment to achieve the interventional training, thus is capable of suppressing the bias caused by the bag contextual prior. Note that the principle of IBMIL is orthogonal to existing bag MIL methods. Therefore, IBMIL is able to bring consistent performance boosting to existing schemes, achieving new state-of-the-art performance. Code is available at https://github.com/HHHedo/IBMIL.

研究の動機と目的

  • MIL における gigapixel WSIs のバッグ文脈先験バイアスに対処する。
  • バッグ予測における do(X) を達成するためのバックドア調整を用いた介入的学習フレームワークを提案する。
  • IBMIL が複数の特徴抽出器とアグリゲータにまたがって既存の MIL 手法を向上させることを示す。
  • 公開 WSI データセットでの因果混乱因子モデリングの実装を提供し評価する。

提案手法

  • バッグ X、ラベル Y、バッグ文脈 C からなる構造因果モデルで MIL 問題をモデル化する。
  • 第3の学習段階を導入し、混乱因子 C を用いて P(Y|do(X)) を計算するバックドア調整を実行する。
  • K-means によるクラスタリングを用いて C を近似する混乱因子辞書を構築し、学習済みの射影とソフトマックス重み付けにより h(X,c_i) を計算する。
  • 第2段階の既存の MIL アグリゲータでバッグ特徴を集約し、ステージ3 で単一の前向き伝播パス(式7)を用いてバックドア調整済み予測を適用する。
  • 全ての文脈を列挙してバックドア調整を実装する代わりに、実用的な近似として一様事前分布 P(c_i) を仮定する。
  • 混乱因子辞書サイズ、結合特徴次元、混乱因子の学習可能性 vs 固定、アグリゲーション方式など、様々な設計選択を検討する。
  • 複数の特徴抽出器(ResNet、ViT、CTransPath)と MIL アグリゲータ(ABMIL、DSMIL、TransMIL、DTFD-MIL)との互換性をデータセット間で実証する。

実験結果

リサーチクエスチョン

  • RQ1バックドア調整を用いた介入的学習段階で、WSI MIL 予測の混乱を引き起こすバッグ文脈バイアスを除去できるか。
  • RQ2 IBMIL は異なる特徴抽出器と MIL アグリゲータと互換性があり、性能向上を一貫して提供するか。
  • RQ3混乱因子辞書サイズ、特徴空間次元、混乱因子の学習可能性などの選択が性能にどう影響するか。
  • RQ4 IBMIL は非パラメトリックなアグリゲータを改善し、ラベルなしデータと共に混乱因子を効果的に近似できるか。

主な発見

方法Camelyon16 PrecisionCamelyon16 RecallCamelyon16 AccuracyCamelyon16 AUCTCGA-NSCLC PrecisionTCGA-NSCLC RecallTCGA-NSCLC AccuracyTCGA-NSCLC AUC
ABMIL86.7181.7184.5084.0782.7585.8481.4388.95
ABMIL + IBMIL88.5887.1488.3790.4385.4285.1785.2491.26
DSMIL84.5682.9584.5087.1680.5685.7877.6286.88
DSMIL + IBMIL90.1786.2088.3787.6981.9886.2580.0087.19
TransMIL85.4381.0683.7281.2985.4685.3185.2490.70
TransMIL + IBMIL83.1482.9383.7288.7185.8087.0685.2492.54
  • IBMIL は Camelyon16 および TCGA-NSCLC の両方で、すべての検証済み特徴抽出器とアグリゲータを一貫して改善する。
  • ResNet ベースのベースラインでの IBMIL の平均 AUC は Camelyon16 で 5.4%、TCGA-NSCLC で 1.5% の改善。
  • IBMIL は Camelyon16(不均衡な二値 MIL)でより大きな利得を生み出し、TCGA-NSCLC(多クラス/バランス設定)よりも大きな改善を示す。
  • 混乱因子辞書サイズと結合特徴次元に対して性能向上が持続し、これらのハイパーパラメータに対してロバスト性を示す。
  • 学習不能な混乱因子はこの設定では一般に学習可能な混乱因子よりも良い性能を示す。
  • IBMIL は非パラメトリックアグリゲータ(平均/最大)を改善でき、単なる事後処理ではなく介入的学習アプローチから得られる利得である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。