[论文解读] Towards better Validity: Dispersion based Clustering for Unsupervised Person Re-identification
本文提出了一种基于离散度的聚类(DBC)方法,用于无监督行人重识别,通过联合优化组内紧凑性和组间分离性来提升聚类有效性。该方法在无监督方法中显著领先,在Market-1501上达到69.2%的rank-1和41.3%的mAP,在DukeMTMC-VideoReID上达到75.2%的rank-1和66.1%的mAP。
Person re-identification aims to establish the correct identity correspondences of a person moving through a non-overlapping multi-camera installation. Recent advances based on deep learning models for this task mainly focus on supervised learning scenarios where accurate annotations are assumed to be available for each setup. Annotating large scale datasets for person re-identification is demanding and burdensome, which renders the deployment of such supervised approaches to real-world applications infeasible. Therefore, it is necessary to train models without explicit supervision in an autonomous manner. In this paper, we propose an elegant and practical clustering approach for unsupervised person re-identification based on the cluster validity consideration. Concretely, we explore a fundamental concept in statistics, namely \emph{dispersion}, to achieve a robust clustering criterion. Dispersion reflects the compactness of a cluster when employed at the intra-cluster level and reveals the separation when measured at the inter-cluster level. With this insight, we design a novel Dispersion-based Clustering (DBC) approach which can discover the underlying patterns in data. This approach considers a wider context of sample-level pairwise relationships to achieve a robust cluster affinity assessment which handles the complications may arise due to prevalent imbalanced data distributions. Additionally, our solution can automatically prioritize standalone data points and prevents inferior clustering. Our extensive experimental analysis on image and video re-identification benchmarks demonstrate that our method outperforms the state-of-the-art unsupervised methods by a significant margin. Code is available at https://github.com/gddingcs/Dispersion-based-Clustering.git.
研究动机与目标
- 解决因人工标注成本过高而难以进行手动标注的无监督行人重识别挑战。
- 克服现有聚类方法依赖固定聚类数量或次优合并启发式规则的局限性。
- 提升在真实世界行人重识别数据集中常见的不平衡数据分布下的聚类鲁棒性。
- 开发一种自然处理孤立点且无需外部监督即可防止低质量聚类的聚类有效性准则。
- 在无需依赖标注数据或辅助数据集的情况下,实现在图像和视频重识别基准上的最先进性能。
提出的方法
- 提出一种基于离散度的聚类(DBC)框架,通过组内紧凑性和组间分离性来评估聚类质量。
- 基于离散度定义合并准则:优先选择组内离散度低(紧凑聚类)和组间离散度高(良好分离聚类)的组合。
- 使用聚类间的平均链接作为组间离散度的度量,以指导合并决策。
- 引入一种基于离散度的亲和力评估,考虑样本间更广泛的成对关系,从而提升对不平衡分布的鲁棒性。
- 自动检测并优先处理孤立点,避免其被纳入低质量聚类。
- 以分层、自底向上的方式应用DBC算法,基于离散度准则迭代合并聚类,无需预设聚类数量。
实验结果
研究问题
- RQ1基于统计学基础的聚类有效性度量是否能提升无监督行人重识别中的聚类性能?
- RQ2在处理复杂且不平衡的数据分布时,基于离散度的聚类与基于启发式合并规则(如最小距离)相比表现如何?
- RQ3基于离散度的准则在多大程度上能防止将不同身份错误合并,同时保持聚类的紧凑性?
- RQ4该方法在无需外部监督的情况下,是否能有效泛化到图像和视频重识别基准?
- RQ5即使在使用辅助监督信号的方法(如属性标签或少样本学习)存在的情况下,该方法是否仍能超越当前最先进水平的无监督和弱监督方法?
主要发现
- 所提出的DBC方法在Market-1501上达到69.2%的rank-1和41.3%的mAP,相比之前最先进方法BUC在rank-1准确率上高出3个百分点。
- 在DukeMTMC-reID上,DBC达到68.5%的rank-1和42.1%的mAP,表明其对无监督基线方法具有持续改进效果。
- 在基于视频的基准上,DBC在DukeMTMC-VideoReID上达到75.2%的rank-1和66.1%的mAP,相比BUC在rank-1上高出6个百分点,在mAP上高出4.2个百分点。
- 该方法在多个聚类阶段均保持稳定性能,其准确率下降速度慢于BUC,表明对聚类数量变化具有更强的鲁棒性。
- 即使与使用属性标签(TJ-AIDL)或少样本学习(EUG)的方法相比,DBC在完全无监督条件下仍分别高出11%和13.4%的rank-1准确率。
- T-SNE可视化结果的定性分析表明,DBC能有效将同一身份的样本聚在一起,同时最小化将外观相似但身份不同的样本错误合并。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。