QUICK REVIEW
[论文解读] Semi-Supervised Learning with Generative Adversarial Networks
Augustus Odena|arXiv (Cornell University)|Jun 5, 2016
Generative Adversarial Networks and Image Synthesis参考文献 9被引用 542
一句话总结
将 GAN 扩展到半监督学习,通过让判别器输出 N+1 个类别(N 个真实类别加上一个伪类),实现分类器与生成器的联合训练,并带来数据高效的分类与更好的样本质量。
ABSTRACT
We extend Generative Adversarial Networks (GANs) to the semi-supervised context by forcing the discriminator network to output class labels. We train a generative model G and a discriminator D on a dataset with inputs belonging to one of N classes. At training time, D is made to predict which of N+1 classes the input belongs to, where an extra class is added to correspond to the outputs of G. We show that this method can be used to create a more data-efficient classifier and that it allows for generating higher quality samples than a regular GAN.
研究动机与目标
- 激励并开发一种在训练生成模型的同时进行半监督分类的方法。
- 使判别器除了 real/fake 之外还能输出类别标签,为 G、D 和 C 创建共享表示。
- 展示在 MNIST 上通过联合 G-D-C 训练获得的数据效率提升和更高的样本质量。
提出的方法
- 扩增 GAN 判别器,使其具有 N+1 个输出,对应 N 个真实类别加一个 FAKE 类。
- 训练 D/C 以最小化观测标签在数据上的负对数似然,以及在生成样本上的 FAKE 标签;训练 G 以最大化 D/C 的准确性。
- 使用单一网络结构,在判别和分类任务之间共享权重(D 充当 C)。
- 可选地将 SGAN 与在不更新生成器的情况下训练的基线分类器进行比较。
- 在不同数据可用性下评估 MNIST 的生成质量和分类准确率。
实验结果
研究问题
- RQ1GAN 判别器是否可以扩展为输出显式的类别标签,以实现半监督学习?
- RQ2在标注数据有限的情况下,将判别和分类的权重共享是否能提高 MNIST 的数据效率?
- RQ3联合的 G-D-C 训练是否比标准 GAN 产生更高质量的样本并更快地训练生成器?
- RQ4在使用真实类别标签与仅使用 REAL/FAKE 标签时,SGAN 的性能对比如何?
- RQ5作为半监督学习框架,SGAN 的实际好处与局限性是什么?
主要发现
| 示例 | CNN | SGAN |
|---|---|---|
| 1000 | 0.965 | 0.964 |
| 100 | 0.895 | 0.928 |
| 50 | 0.859 | 0.883 |
| 25 | 0.750 | 0.802 |
- 在 MNIST 上,无论初始化如何,SGAN 的输出样本都明显比标准 GAN 更清晰。
- 随着标注数据减少,SGAN 的表现优于在不更新生成器的情况下训练的基线分类器,表明数据效率提高。
- 在有限训练数据下,SGAN 的分类准确率高于基线。
- 分类器准确率示例显示,在较小的数据量下,SGAN 的准确率高于 CNN 基线。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。