QUICK REVIEW

[논문 리뷰] Interventional Bag Multi-Instance Learning On Whole-Slide Pathological Images

Tiancheng Lin, Zhimiao Yu|arXiv (Cornell University)|2023. 03. 13.

AI in cancer detection인용 수 8

한 줄 요약

IBMIL은 WSIs에서 가방 수준 MIL의 맥락 편향을 완화하기 위해 backdoor 조정을 이용한 개입적 학습 단계를 도입하여 기존 MIL 방법의 성능을 향상시킨다.

ABSTRACT

Multi-instance learning (MIL) is an effective paradigm for whole-slide pathological images (WSIs) classification to handle the gigapixel resolution and slide-level label. Prevailing MIL methods primarily focus on improving the feature extractor and aggregator. However, one deficiency of these methods is that the bag contextual prior may trick the model into capturing spurious correlations between bags and labels. This deficiency is a confounder that limits the performance of existing MIL methods. In this paper, we propose a novel scheme, Interventional Bag Multi-Instance Learning (IBMIL), to achieve deconfounded bag-level prediction. Unlike traditional likelihood-based strategies, the proposed scheme is based on the backdoor adjustment to achieve the interventional training, thus is capable of suppressing the bias caused by the bag contextual prior. Note that the principle of IBMIL is orthogonal to existing bag MIL methods. Therefore, IBMIL is able to bring consistent performance boosting to existing schemes, achieving new state-of-the-art performance. Code is available at https://github.com/HHHedo/IBMIL.

연구 동기 및 목표

MIL에서 gigapixel WSIs의 가방 맥락 편향 해결.
bag 예측에서 do(X)를 달성하기 위한 backdoor 조정을 이용한 개입적 학습 프레임워크 제안.
IBMIL이 여러 특성 추출기와 집계기에서 기존 MIL 방법을 향상시키는지 입증.
공개 WSI 데이터셋에서 혼란변수 모델링의 실용적 구현을 제공하고 평가.

제안 방법

가방 X, 라벨 Y, 가방 맥락 C로 구성된 구조 인과 모델로 MIL 문제를 모델링.
맥락 C를 이용해 P(Y|do(X))를 계산하는 backdoor 조정을 수행하는 세 번째 학습 단계를 도입.
클러스터링(K-means)을 통한 가방 특성으로 혼란변수 사전(Dictionary)을 구성해 C를 근사하고 학습된 투영 및 소프트맥스 가중치를 통해 h(X,c_i)를 계산.
2단계에서 기존 MIL 집계기로 가방 특성을 집계한 뒤, 3단계에서 단일 순전파 패스(식 7)를 사용해 backdoor 조정된 예측을 적용.
균일 사전 P(c_i) 가정을 하고 모든 맥락을 열거하지 않고도 backdoor 조정을 구현하는 실용적 근사치를 사용.
혼란변수 사전 크기, 결합 특성 차원, 학습 가능한 대 고정 혼란변수, 집계 스킴 등 다양한 설계 선택지를 조사.
여러 특성 추출기(ResNet, ViT, CTransPath) 및 MIL 집계기(ABMIL, DSMIL, TransMIL, DTFD-MIL)와의 다Dataset 호환성을 보여준다.

실험 결과

연구 질문

RQ1백도어 조정을 통한 개입 학습 단계가 WSI MIL 예측에서 혼란스러운 가방 맥락 편향을 제거할 수 있는가?
RQ2IBMIL은 서로 다른 특징 추출기와 MIL 집계기에 호환되며 일관된 성능 향상을 제공하는가?
RQ3혼란변수 사전 크기, 특징 공간 차원, 혼란변수 학습 가능성 등의 선택이 성능에 어떤 영향을 미치는가?
RQ4IBMIL이 비모수적 집계기(mean/max)를 개선하고 비표지 데이터와 함께 혼란변수를 효과적으로 근사할 수 있는가?

주요 결과

Method	Camelyon16 Precision	Camelyon16 Recall	Camelyon16 Accuracy	Camelyon16 AUC	TCGA-NSCLC Precision	TCGA-NSCLC Recall	TCGA-NSCLC Accuracy	TCGA-NSCLC AUC
ABMIL	86.71	81.71	84.50	84.07	82.75	85.84	81.43	88.95
ABMIL + IBMIL	88.58	87.14	88.37	90.43	85.42	85.17	85.24	91.26
DSMIL	84.56	82.95	84.50	87.16	80.56	85.78	77.62	86.88
DSMIL + IBMIL	90.17	86.20	88.37	87.69	81.98	86.25	80.00	87.19
TransMIL	85.43	81.06	83.72	81.29	85.46	85.31	85.24	90.70
TransMIL + IBMIL	83.14	82.93	83.72	88.71	85.80	87.06	85.24	92.54

IBMIL은 Camelyon16과 TCGA-NSCLC 모두에서 모든 테스트 특성 추출기와 집계기에 일관되게 향상을 보인다.
ResNet 기반 베이스라인에서 IBMIL의 평균 AUC 개선은 Camelyon16에서 5.4%, TCGA-NSCLC에서 1.5%이다.
IBMIL은 비대칭 이진 MIL인 Camelyon16에서 TCGA-NSCLC(다중 클래스/균형 설정)보다 더 큰 이득을 준다.
혼란변수 사전 크기와 결합 특성 차원에 걸쳐 성능 이득이 지속되며 이 하이퍼파라미터에 대해 견고하다.
학습되지 않는 혼란변수가 일반적으로 이 설정에서 학습 가능한 혼란변수보다 더 우수한 성능을 낸다.
IBMIL은 비모수적 집계기(mean, max)도 개선할 수 있으며 단순한 포스트-프로세스가 아니라 개입 학습 방식에서 얻은 이득이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.