QUICK REVIEW

[论文解读] Acceleration of Large Margin Metric Learning for Nearest Neighbor Classification Using Triplet Mining and Stratified Sampling

Parisa Abdolrahim Poorheravi, Benyamin Ghojogh|arXiv (Cornell University)|Jan 15, 2021

Face and Expression Recognition参考文献 31被引用 4

一句话总结

本文提出三元组挖掘技术与分层分层抽样方法，以加速大规模度量学习用于最近邻分类。通过仅选择最具信息量的三元组（例如，难负样本、半难正样本）并使用分层超球面上的迭代抽样，该方法将计算成本降低了高达95%，同时在Fisher Iris、ORL Faces和MNIST数据集上保持或提升了分类准确率。

ABSTRACT

This article is published by the Journal of Computational Vision and Imaging Systems, available here: https://doi.org/10.15353/jcvis.v6i1.3534. This journal provides immediate open access to its content on the principle that making research freely available to the public supports a greater global exchange of knowledge.

研究动机与目标

解决使用半定规划（SDP）进行大规模度量学习时计算成本过高的问题，因其在大规模数据集上运行缓慢。
将孪生网络中的三元组挖掘技术适配到基于SDP的k-NN分类度量学习中，以加速训练。
开发一种分层分层抽样框架，以进一步提升可扩展性与训练效率。
通过聚焦于信息量丰富的三元组，实现优化速度的提升而不牺牲分类性能。

提出的方法

提出七种基于孪生网络挖掘策略的三元组挖掘方法——k-BA、k-BH、k-BSH、k-HPEN、k-EPEN、k-EPHN、k-NS，用于SDP优化。
使用马氏距离与投影矩阵L，学习一个判别性子空间，以最小化类内方差并最大化类间方差。
采用分层方法，在嵌套的超球面上进行分层抽样，以迭代方式选择用于训练的数据子集。
将三元组挖掘与分层抽样相结合，以降低时间复杂度并减少估计方差。
通过分层训练实现模型平均，以提升泛化能力与鲁棒性。
使用概率分布进行负样本抽样（例如k-NS），以优先选择难样本或信息量丰富的负样本。

实验结果

研究问题

RQ1能否有效将孪生网络中的三元组挖掘技术迁移至基于SDP的大规模度量学习中以实现加速？
RQ2分层分层抽样如何提升度量学习的可扩展性与效率？
RQ3不同三元组挖掘策略（例如，难样本、半难样本、最易/最难样本）对分类准确率与训练时间有何影响？
RQ4将三元组挖掘与分层抽样结合是否能获得优于非分层方法的性能与更快收敛速度？
RQ5不同挖掘策略如何影响面部数据集中可视化出的特征子空间（例如，幽灵人脸）？

主要发现

在Fisher Iris数据集上，分层方法在使用k-BA挖掘策略时实现了100%的准确率，训练时间减少97%（23.73秒 vs. 832.85秒）。
在ORL Faces数据集上，k-BSH挖掘方法在分层设置下达到最高准确率（81.25%），优于非分层基线方法。
在MNIST数据集上，k-HPEN与k-BSH方法在分层设置下分别实现了81.00%与82.00%的准确率，训练时间从超过120秒降低至5秒以下。
k-NS（负样本抽样）方法生成了最具判别性的幽灵人脸，突出显示了眼睛、眉毛和眼镜等特征。
分层方法使得在大规模数据集上高效使用k-BA（所有负样本）成为可能，此前因计算成本过高而不可行。
模型平均与分层抽样降低了估计方差，在ORL与MNIST数据集上尽管使用了更小的数据子集，仍实现了性能提升。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。