Skip to main content
QUICK REVIEW

[论文解读] Long-Tailed Partial Label Learning via Dynamic Rebalancing

Hong Feng, Jiangchao Yao|arXiv (Cornell University)|Feb 10, 2023
Text and Document Classification Technologies被引用 8
一句话总结

RECORDS 引入一个动态再平衡机制用于长尾部分标签学习,在训练过程中自适应标签消歧义,无需先验类别分布即可提升性能.

ABSTRACT

Real-world data usually couples the label ambiguity and heavy imbalance, challenging the algorithmic robustness of partial label learning (PLL) and long-tailed learning (LT). The straightforward combination of LT and PLL, i.e., LT-PLL, suffers from a fundamental dilemma: LT methods build upon a given class distribution that is unavailable in PLL, and the performance of PLL is severely influenced in long-tailed context. We show that even with the auxiliary of an oracle class prior, the state-of-the-art methods underperform due to an adverse fact that the constant rebalancing in LT is harsh to the label disambiguation in PLL. To overcome this challenge, we thus propose a dynamic rebalancing method, termed as RECORDS, without assuming any prior knowledge about the class distribution. Based on a parametric decomposition of the biased output, our method constructs a dynamic adjustment that is benign to the label disambiguation process and theoretically converges to the oracle class prior. Extensive experiments on three benchmark datasets demonstrate the significant gain of RECORDS compared with a range of baselines. The code is publicly available.

研究动机与目标

  • 将 LT-PLL 作为具有标签歧义和类别不平衡的实际场景进行动机阐述。
  • 识别在 LT-PLL 中即使存在 oracle 先验时,常数再平衡的局限性。
  • 提出 RECORDS,一种动态、无先验的再平衡方法以稳定标签消歧义。
  • 在小歧义条件下对收敛性及与 oracle 先验的关系进行理论分析。
  • 在多个 LT-PLL 基准和基线方法上展示经验收益。

提出的方法

  • 将 LT-PLL 表述为带有偏差模型输出和候选标签集的设置。
  • 引入 RECORDS,通过动态、参数化的类别分布对输出进行去偏。
  • 通过一个动量更新的原型特征 F (Eq. 5) 来估计动态类别分布 P_train(y|Θ)。
  • 通过将对数it 与 -log P_train(y|Θ) 调整来得到 P_uni(y|x;Θ)(Eq. 6)。
  • 将 RECORDS 作为一个轻量级模块嵌入到现有 PLL 方法中,以端到端的方式工作。
  • 给出理论洞见,证明在小歧义条件下动态再平衡向 oracle 先验收敛(Proposition 4.1)。

实验结果

研究问题

  • RQ1在无法获得真实类别分布的情况下,动态再平衡是否能改善 LT-PLL?
  • RQ2动态再平衡在训练过程中如何与标签消歧义相互作用?
  • RQ3在现实的歧义条件下,RECORDS 是否会向 oracle 先验收敛?
  • RQ4RECORDS 在标准 LT-PLL 基准和 PLL 基线上的经验收益有多大?
  • RQ5RECORDS 是否是正交并且可以轻松地插入到现有 PLL 方法中?

主要发现

  • RECORDS 在 CIFAR-10-LT、CIFAR-100-LT、以及 LT-PLL 条件下的 PASCAL VOC 上,持续优于强基线 PLL(如 CORR、PRODEN、LW、CAVL)。
  • RECORDS 相对于最佳基线带来显著提升,在 PASCAL VOC 上相对提升高达 32.03%,在 CIFAR-10-LT/CIFAR-100-LT 上也有显著收益。
  • 动态再平衡在训练过程中向 oracle 类别先验收敛,最终估计与先验高度一致(L2 距离显著减小)。
  • 该方法轻量、端到端,且与现有 PLL 损失函数正交,在候选生成非均匀时仍保持鲁棒性。
  • 线性探测实验显示 RECORDS 提供比基线更优的表征。
  • RECORDS 优于其他动态策略,且在不对头部类别过度调整的情况下保持对尾部类别的改进表现。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。