QUICK REVIEW

[論文レビュー] Semi-supervised Learning with GANs: Manifold Invariance with Improved Inference

Abhishek Kumar, Prasanna Sattigeri|arXiv (Cornell University)|May 24, 2017

Generative Adversarial Networks and Image Synthesis参考文献 25被引用数 83

ひとこと要約

本論文は GAN 生成の多様体接線を用いて半教師あり学習の分類器に不変性を注入し、拡張エンコーダー（Augmented-BiGAN）を導入してクラススイッチングを低減し、特にラベル付きデータが少ない場合に性能が向上することを示す。

ABSTRACT

Semi-supervised learning methods using Generative Adversarial Networks (GANs) have shown promising empirical success recently. Most of these methods use a shared discriminator/classifier which discriminates real examples from fake while also predicting the class label. Motivated by the ability of the GANs generator to capture the data manifold well, we propose to estimate the tangent space to the data manifold using GANs and employ it to inject invariances into the classifier. In the process, we propose enhancements over existing methods for learning the inverse mapping (i.e., the encoder) which greatly improves in terms of semantic similarity of the reconstructed sample with the input sample. We observe considerable empirical gains in semi-supervised learning over baselines, particularly in the cases when the number of labeled examples is low. We also provide insights into how fake examples influence the semi-supervised learning procedure.

研究の動機と目的

GANのデータ多様体を活用して分類器に不変性を注入し、より良い半教師あり学習を実現する動機づけ。
データと潜在空間の間を安定に写像し、意味的に近い再構成を回復するエンコーダ–ジェネレータ–ディスクリミネータの訓練 regime を開発する。
GANを用いてデータ多様体の支配的な接線方向を推定し、分類器の挙動を正則化する。
再構成サンプルのクラススイッチングを減らしエンコーダ訓練を改善するための Augmented-BiGAN を提案する。
偽データの例が半教師付きGANベースの学習に与える影響について実証的知見を提供する。

提案手法

GANを生成器 g: Z -> X としてモデル化し、エンコーダ h のヤコビ行列 J_h(x) によって接線空間 T_xM を推定し、J_x h を用いて支配的な接線方向を得る。
特徴マッチング損失を備えた BiGAN を用いてジェネレータと共に逆写像（エンコーダ h）を訓練し、x と g(h(x)) の意味的類似性を高める。
識別器の偽集合に (h(x), g(h(x))) のペアを含めて Augmented-BiGAN を導入し、クラススイッチングをさらに低減する。
エンコーダ h からの接線を近似するために、低次元の非線形写像 p および p-bar を学習して支配的接線の小さな集合（d_p 方向）を推定し、実用的な接線推定を可能にする。
接線基盤の不変性を Tangent Propagation（TangentProp）を用いて分類器に注入し、接線方向に沿った分類器感度を罰する正則化項（Jacobian-based regularization）で実現する。
半教師あり識別器を、実データとラベルなし/偽データの両方で訓練し、ジェネレータには特徴マッチングを用いて学習を安定化させる。

実験結果

リサーチクエスチョン

RQ1GAN はローカルデータ多様体の接線を信頼性高く推定して、分類器に不変性を導入する情報を提供できるか。
RQ2実画像を潜在空間に写像するエンコーダを学習することは、再構成の意味的一貫性（x と g(h(x))）を改善するか。
RQ3偽ペアの追加監督（Augmented-BiGAN）で再構成のクラススイッチングを減らせるか。
RQ4接線ベースの正則化（TangentProp および Jacobian-norm）は、特にラベルが限られている場合に半教師付きGANの性能を向上させるか。

主な発見

生成器起源の接線方向を用いて不変性を注入することで、半教師付き学習で顕著な改善をもたらし、特に少量のラベル例を持つ SVHN で顕著。
Augmented-BiGAN は BiGAN より入力と再構成の意味的整合性を改善し、クラススイッチングを低減する。
ジェネレータの特徴マッチング損失は学習を安定化させ、再構成の意味的一致性（x と g(h(x))）を改善する。
接線ベースの正則化（TangentProp および Jacobian-norm）は、多様体方向に沿った不変性を課すことで分類器の頑健性を高める。
実証結果は SVHN で CIFAR-10 より大きな改善を示し、接線推定をより正確に行えば CIFAR-10 でも改善の可能性がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。