QUICK REVIEW

[论文解读] A Strong Baseline for Fashion Retrieval with Person Re-Identification Models

Mikołaj Wieczorek, Andrzej Michałowski|arXiv (Cornell University)|Mar 9, 2020

Face recognition and analysis参考文献 10被引用 13

一句话总结

该论文通过适配最先进的人体重识别（ReID）模型，提出了一种简单但极为有效的时尚检索基线方法，具体采用ResNet50-IBN-A主干网络与四元组损失（quadruplet loss）。尽管结构简单，该模型在Street2Shop（54.8 mAP，72.9 Acc@20）和DeepFashion（40.0 Acc@1，79.0 Acc@20）两个数据集上均取得了新的最先进性能，证明了仅通过极少的网络结构修改，即可有效将ReID模型迁移至时尚检索任务，并显著提升准确率。

ABSTRACT

Fashion retrieval is the challenging task of finding an exact match for fashion items contained within an image. Difficulties arise from the fine-grained nature of clothing items, very large intra-class and inter-class variance. Additionally, query and source images for the task usually come from different domains - street photos and catalogue photos respectively. Due to these differences, a significant gap in quality, lighting, contrast, background clutter and item presentation exists between domains. As a result, fashion retrieval is an active field of research both in academia and the industry. Inspired by recent advancements in Person Re-Identification research, we adapt leading ReID models to be used in fashion retrieval tasks. We introduce a simple baseline model for fashion retrieval, significantly outperforming previous state-of-the-art results despite a much simpler architecture. We conduct in-depth experiments on Street2Shop and DeepFashion datasets and validate our results. Finally, we propose a cross-domain (cross-dataset) evaluation method to test the robustness of fashion retrieval models.

研究动机与目标

探究在两项任务具有强相似性的情况下，是否可将为人重识别（ReID）预训练模型有效适配至时尚检索任务。
建立一种简单且高效的时尚检索基线，其性能超越以往更复杂、专为任务设计的模型。
通过一种新颖的跨域（跨数据集）评估协议，评估模型的鲁棒性，以模拟在不同数据分布下的真实世界部署场景。
证明从ReID到时尚检索的迁移学习可在极少网络结构修改下，实现显著的性能提升。

提出的方法

通过修改损失函数与训练策略，将领先的ReID模型（特别是采用ResNet50-IBN-A主干的RST模型）适配至时尚检索任务。
采用四元组损失函数，通过对比锚点、正样本与两个负样本，增强特征判别能力，从而提升嵌入质量。
使用全局平均池化与度量学习头，生成用于检索的图像嵌入，嵌入空间由模型端到端学习。
在推理后应用重排序策略，利用余弦相似度与特征重加权，优化top-k检索结果。
通过在某一数据集（如DeepFashion）上训练、在另一数据集（如Street2Shop）上测试的方式，开展跨域评估，以模拟领域偏移。
在全图库范围内执行无约束检索，以评估真实世界性能，避免评估中出现类别偏差。

实验结果

研究问题

RQ1尽管存在领域与内容差异，基于人重识别预训练的模型是否可被有效适配至时尚检索任务？
RQ2基于ReID模型构建的简单、非优化架构，是否能超越更复杂、专为任务设计的时尚检索模型？
RQ3在跨域设置下，ReID模型的性能在不同数据分布间如何泛化？
RQ4四元组损失与重排序在多大程度上提升了时尚检索的准确率？

主要发现

所提出的基于ReID的基线模型在Street2Shop数据集上取得了54.8 mAP与72.9 Acc@20的性能，创下新的最先进水平。
在DeepFashion数据集上，模型实现了40.0 Acc@1与79.0 Acc@20的性能，显著超越此前最先进方法。
尽管所用图像分辨率仅为此前方法的数分之一，模型仍表现出色，表明其具备高度效率与鲁棒性。
跨域评估显示，当在Street2Shop上训练、在DeepFashion上测试时，模型在DeepFashion上达到37.7 Acc@1，表明所学表征具有良好的可迁移性。
重排序策略在所有指标上均提升了性能，其中Street2Shop的mAP相对提升达7.5%，证明其在优化top-k结果中的有效性。
四元组损失相比三元组损失带来了可测量的性能增益，尤其在减少细粒度检索中的误报方面表现显著。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。