QUICK REVIEW

[论文解读] StRDAN: Synthetic-to-Real Domain Adaptation Network for Vehicle Re-Identification

Sangrok Lee, Eunsoo Park|arXiv (Cornell University)|Apr 25, 2020

Domain Adaptation and Few-Shot Learning参考文献 33被引用 40

一句话总结

该论文提出 StRDAN，一种用于车辆重识别的合成到真实域自适应网络，结合对抗性域自适应与半监督学习，利用大规模合成数据与有限真实数据。通过在两个域上联合和分离地使用身份、颜色、类型和方向的损失进行训练，StRDAN 在 CityFlow-ReID 和 VeRi 数据集上分别相比仅使用真实数据的基线模型实现了 12.9% 和 3.1% 的 mAP 提升。

ABSTRACT

Vehicle re-identification aims to obtain the same vehicles from vehicle images. This is challenging but essential for analyzing and predicting traffic flow in the city. Although deep learning methods have achieved enormous progress for this task, their large data requirement is a critical shortcoming. Therefore, we propose a synthetic-to-real domain adaptation network (StRDAN) framework, which can be trained with inexpensive large-scale synthetic and real data to improve performance. The StRDAN training method combines domain adaptation and semi-supervised learning methods and their associated losses. StRDAN offers significant improvement over the baseline model, which can only be trained using real data, for VeRi and CityFlow-ReID datasets, achieving 3.1% and 12.9% improved mean average precision, respectively.

研究动机与目标

通过利用大规模、低成本的合成数据，解决真实世界车辆 Re-ID 数据有限的挑战。
通过对抗性域自适应，缓解合成图像与真实图像之间的域偏移。
通过半监督学习利用仅在合成数据中可用的辅助标签（颜色、类型、方向），改进特征学习。
在仅需极少真实数据标注的情况下，实现出色的基准数据集性能。

提出的方法

使用 ResNet-50 主干网络从真实和合成图像中提取特征。
采用域判别头与对抗性损失，对齐合成域与真实域的特征分布。
仅在合成数据上应用颜色、类型和方向的分离交叉熵损失，实现半监督学习。
结合车辆 ID 分类、三元组损失与域对抗性损失，实现端到端训练。
采用多任务学习设置，包含五个 softmax 头：用于 ID、域、颜色、类型和方向的分类。
应用数据增强（水平翻转、随机擦除）与重排序后处理，以提升泛化能力。

实验结果

研究问题

RQ1对抗性域自适应能否有效减少合成与真实车辆图像在 Re-ID 中的域偏移？
RQ2仅使用合成数据中的标签（颜色、类型、方向）进行半监督学习，在真实数据上的泛化能力能提升多少？
RQ3不同组合的分离损失（颜色、类型、方向）如何影响最终的 Re-ID 性能？
RQ4在合成数据上使用辅助标签进行训练，是否能带来比仅在真实数据上训练更好的特征学习？

主要发现

在 CityFlow-ReID 数据集上，StRDAN 相比仅使用真实数据的基线模型，mAP 提升了 12.9%。
在 VeRi 数据集上，StRDAN 相比仅使用真实数据的基线模型，mAP 提升了 3.1%。
在 CityFlow-ReID 上，仅使用方向监督（案例 4）时性能最佳，而加入全部三种辅助标签反而导致性能下降。
在 VeRi 上，仅使用方向监督（案例 2）时性能最佳，表明辅助标签并不总是能提升结果。
在 AI City 数据集上，当同时使用所有分离损失时，模型无法收敛，表明可能存在冲突或过拟合。
性能高度依赖真实世界数据集，表明域偏移与数据质量显著影响模型行为。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。