[论文解读] Batch-Incremental Triplet Sampling for Training Triplet Networks Using Bayesian Updating Theorem
本文提出贝叶斯更新三元组(BUT)和贝叶斯更新NCA(BUNCA),两种新颖的批量增量三元组采样方法,通过从建模类别嵌入的多元正态分布中动态采样正样本和负样本三元组。利用共轭先验的贝叶斯更新,该方法在流式小批量数据中自适应地优化类别分布,提升判别性特征学习能力,并在MNIST和CRC组织病理学数据集上实现最先进性能。
Variants of Triplet networks are robust entities for learning a discriminative embedding subspace. There exist different triplet mining approaches for selecting the most suitable training triplets. Some of these mining methods rely on the extreme distances between instances, and some others make use of sampling. However, sampling from stochastic distributions of data rather than sampling merely from the existing embedding instances can provide more discriminative information. In this work, we sample triplets from distributions of data rather than from existing instances. We consider a multivariate normal distribution for the embedding of each class. Using Bayesian updating and conjugate priors, we update the distributions of classes dynamically by receiving the new mini-batches of training data. The proposed triplet mining with Bayesian updating can be used with any triplet-based loss function, e.g., triplet-loss or Neighborhood Component Analysis (NCA) loss. Accordingly, Our triplet mining approaches are called Bayesian Updating Triplet (BUT) and Bayesian Updating NCA (BUNCA), depending on which loss function is being used. Experimental results on two public datasets, namely MNIST and histopathology colorectal cancer (CRC), substantiate the effectiveness of the proposed triplet mining method.
研究动机与目标
- 通过从现有嵌入中静态采样转向从学习到的类别分布中进行随机采样,改进三元组网络的训练。
- 解决现有三元组挖掘方法仅依赖固定数据实例的局限性,这些方法可能遗漏信息量大、异常或稀有模式。
- 通过类别嵌入的贝叶斯更新,结合不确定性和流式数据,提升模型的鲁棒性和泛化能力。
- 在基准数据集上,使用标准度量学习基准验证基于动态分布的三元组采样方法的有效性。
提出的方法
- 将每个类别的嵌入建模为多元正态分布,由均值和协方差参数化。
- 使用共轭先验(正态-逆维希特分布)实现类别分布的解析贝叶斯更新,以适应新到达的小批量数据。
- 应用贝叶斯更新递归地优化类别分布参数(均值和协方差),随着新训练数据的到达持续更新。
- 从动态更新的多元正态分布中采样正样本和负样本三元组,而非从小批量中固定的样本点采样。
- 支持任意三元组损失函数,包括三元组损失和NCA损失,具备模块化和广泛适用性。
- 将该方法集成到批量增量训练流水线中,实现在训练过程中的在线自适应。
实验结果
研究问题
- RQ1从学习到的类别分布中采样,而非从固定数据点中采样,是否能提升三元组网络的性能?
- RQ2类别嵌入的动态贝叶斯更新如何影响所学表征的判别能力?
- RQ3基于分布的采样是否在检索准确率上优于现有策略(如Batch Hard或DWS)?
- RQ4该方法在真实世界数据集(如组织病理学图像)中面对异常值和数据分布偏移时是否具备鲁棒性?
- RQ5该方法能否在不同数据类型(如手写数字和医学组织切片)上实现泛化?
主要发现
- 在MNIST数据集上,BUT的Recall@1达到88.03%,优于所有基线方法,包括Batch Hard(85.75%)和NCA(85.40%)。
- 在CRC组织病理学数据集上,BUT的Recall@1达到79.14%,仅次于Batch Hard(79.09%),展现出强大的泛化能力。
- BUNCA在MNIST上达到78.67%的Recall@1,在CRC上也达到78.67%,尽管其策略不如BUT激进,但表现稳定,跨数据集一致性高。
- 所提方法显著提升了检索质量,Top-10检索结果在MNIST和组织病理学数据中均与查询图像具有高度视觉相似性。
- 可视化结果证实,该方法能检索到语义上相似的样本,即使在如肿瘤和黏液等复杂模式中亦然。
- 该方法通过贝叶斯不确定性建模有效处理类别分布偏移,降低对异常值的敏感性,保持强鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。