Skip to main content
QUICK REVIEW

[论文解读] Robustness of Conditional GANs to Noisy Labels

Kiran Koshy Thekumparampil, Ashish Khetan|arXiv (Cornell University)|Nov 8, 2018
Machine Learning and Data Classification参考文献 8被引用 37
一句话总结

本文提出 RCGAN 和 RCGAN-U 两种鲁棒的条件生成对抗网络架构,通过建模已知或学习到的混淆矩阵来缓解训练过程中由噪声标签引起的样本质量下降和标签保真度降低问题。通过在生成器反馈回路中应用噪声匹配机制,该方法确保生成器学习到真实的干净条件分布,在 MNIST 和 CIFAR-10 数据集上均优于标准 GAN,即使在标签存在噪声的情况下亦表现出色。

ABSTRACT

We study the problem of learning conditional generators from noisy labeled samples, where the labels are corrupted by random noise. A standard training of conditional GANs will not only produce samples with wrong labels, but also generate poor quality samples. We consider two scenarios, depending on whether the noise model is known or not. When the distribution of the noise is known, we introduce a novel architecture which we call Robust Conditional GAN (RCGAN). The main idea is to corrupt the label of the generated sample before feeding to the adversarial discriminator, forcing the generator to produce samples with clean labels. This approach of passing through a matching noisy channel is justified by corresponding multiplicative approximation bounds between the loss of the RCGAN and the distance between the clean real distribution and the generator distribution. This shows that the proposed approach is robust, when used with a carefully chosen discriminator architecture, known as projection discriminator. When the distribution of the noise is not known, we provide an extension of our architecture, which we call RCGAN-U, that learns the noise model simultaneously while training the generator. We show experimentally on MNIST and CIFAR-10 datasets that both the approaches consistently improve upon baseline approaches, and RCGAN-U closely matches the performance of RCGAN.

研究动机与目标

  • 解决在随机标签被污染的数据集上训练条件 GAN 所面临的挑战,此类问题会导致生成结果偏差和样本质量下降。
  • 开发一种方法,在标签受已知或未知噪声过程污染的情况下,仍能恢复真实的条件数据分布 $ P_{X|Y} $。
  • 在特定判别器约束条件下,为所提出的 GAN 架构提供鲁棒性的理论保证。
  • 设计一种训练框架,能够同时学习噪声模型与生成器,从而在信息量较低的场景下实现鲁棒性。
  • 在不同噪声水平下,通过 inception 分数、标签准确率和视觉保真度指标,展示所提方法相对于基线 GAN 的持续性能提升。

提出的方法

  • 提出 RCGAN 用于已知噪声模型:在输入判别器前对生成的标签进行污染,通过噪声匹配机制使生成器输出与干净分布对齐。
  • 引入一种投影判别器架构,满足在已知噪声条件下收敛至真实干净分布的理论条件。
  • 将 RCGAN 损失形式化为一种极小极大目标,其中生成器被训练以生成在经噪声污染后能匹配真实噪声数据分布的样本。
  • 通过在训练过程中联合学习混淆矩阵 $ C $,将 RCGAN 扩展至 RCGAN-U 以处理未知噪声模型。
  • 使用线性分类器作为正则化项,以稳定 RCGAN-U 中混淆矩阵的学习过程,尤其在 CIFAR-10 等复杂数据集上表现更优。
  • 在 RCGAN-U 中对混淆矩阵采用对角线初始化,以防止收敛至真实噪声矩阵的置换版本。

实验结果

研究问题

  • RQ1能否通过显式建模标签污染过程,使条件 GAN 对噪声标签具备鲁棒性?
  • RQ2判别器类需满足何种理论条件,才能确保最小化 RCGAN 损失可恢复真实的干净数据分布?
  • RQ3当噪声模型未知时,RCGAN-U 的性能与 RCGAN 相比如何?
  • RQ4在不同标签噪声水平下,所提方法在 MNIST 和 CIFAR-10 上对样本质量和标签准确率的提升程度如何?
  • RQ5使用投影判别器与噪声匹配机制是否能带来比标准 GAN 更优的泛化性能,尤其是在标签被污染的情况下?

主要发现

  • 在 MNIST 和 CIFAR-10 上,RCGAN 的 inception 分数显著高于基线 GAN,在 0.0 噪声(100% 清洁标签)时达到 0.995,而无偏置 GAN 为 0.994。
  • 在噪声 MNIST 数据集上,RCGAN-U 在 0.1 噪声(90% 清洁标签)时实现 0.995 的标签准确率,优于同噪声水平下的有偏置 GAN(0.873)与无偏置 GAN(0.998)。
  • 在 CIFAR-10 上,RCGAN-U 在 0.0 噪声时保持 8.13% 的生成标签准确率,与无偏置 GAN(8.13%)非常接近,而有偏置 GAN 则下降至 7.6%。
  • 在 80% 标签噪声(1–α = 0.8)条件下,RCGAN-U 在 CIFAR-10 上实现 8.03 的 inception 分数,优于无偏置 GAN(4.0)与有偏置 GAN(7.75)。
  • RCGAN 与 RCGAN-U 生成的视觉样本在类别保真度与图像质量方面显著优于有偏置 GAN,尤其在高噪声水平下表现更佳。
  • 在 RCGAN-U 中采用混淆矩阵的对角线初始化,成功避免了在 CIFAR-10 上收敛至真实噪声矩阵的置换版本。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。