QUICK REVIEW

[论文解读] Attention-based Deep Multiple Instance Learning

Maximilian Ilse, Jakub M. Tomczak|arXiv (Cornell University)|Feb 13, 2018

Image Retrieval and Classification Techniques参考文献 36被引用 671

一句话总结

引入了一种基于神经网络的、置换不变的 MIL 框架，具备可训练的注意力池化算子；在多个数据集上达到具有竞争力的结果，并提供可解释的实例级重要性（ROI）.

ABSTRACT

Multiple instance learning (MIL) is a variation of supervised learning where a single class label is assigned to a bag of instances. In this paper, we state the MIL problem as learning the Bernoulli distribution of the bag label where the bag label probability is fully parameterized by neural networks. Furthermore, we propose a neural network-based permutation-invariant aggregation operator that corresponds to the attention mechanism. Notably, an application of the proposed attention-based operator provides insight into the contribution of each instance to the bag label. We show empirically that our approach achieves comparable performance to the best MIL methods on benchmark MIL datasets and it outperforms other methods on a MNIST-based MIL dataset and two real-life histopathology datasets without sacrificing interpretability.

研究动机与目标

将 MIL 重新表述为通过神经网络参数化的伯努利袋标签分布的学习。
开发一个可训练的（基于注意力的）置换不变聚合算子。
通过注意力权重为袋标签提供可解释的实例贡献。
通过神经网络实现实例变换、池化和袋级预测的端到端训练。

提出的方法

将袋概率建模为对称函数 S(X)=g( sum_x f(x) )。
通过神经网络 f_ψ 将每个实例转换为低维嵌入 h_k。
使用一个可微分、可训练的基于注意力的池化对嵌入进行聚合 z = sum_k a_k h_k，其中 a_k 是学习得到的注意力权重。
使用门控机制（tanh 和 sigmoid）来增强注意力权重 a_k 的表达能力。
通过最大化给定 bag X 的伯努利袋标签 Y 的对数似然来进行端到端训练。
通过显示注意力权重突出显示关键实例/ROI 来演示可解释性。

实验结果

研究问题

RQ1 基于神经注意力的 MIL 池化是否能够在标准 MIL 基准测试中达到具有竞争力的袋级准确性？
RQ2 所提出的池化是否提供可解释的实例级贡献（关键实例/ROI）以用于决策解释？
RQ3 基于嵌入的带注意力的 MIL 与基于实例的 MIL 池化（均值/最大值）在多样化数据集上的比较？
RQ4 在像素/注释薄弱或稀缺的的小样本医疗影像场景中，该方法是否有效？

主要发现

基于注意力的深度 MIL 方法在基准数据集上达到与最佳经典 MIL 方法相当的性能，并在基于 MNIST 的 MIL 以及两个组织病理学数据集上优于其他方法。
注意力权重使得能够识别关键实例，在医疗影像任务中提供可解释的 ROI。
基于嵌入的模型通常优于基于实例的模型，且门控注意力在至少某些数据集上相比纯注意力提升了性能。
在 MNIST-bags 实验中，均值池化的表现不如最大池化，而门控注意力变体在各数据集上表现出鲁棒性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。