Skip to main content
QUICK REVIEW

[論文レビュー] Semi-Supervised Few-Shot Learning with Local and Global Consistency

Ahmed Ayyad, Nassir Navab|arXiv (Cornell University)|Mar 6, 2019
Domain Adaptation and Few-Shot Learning被引用数 13
ひとこと要約

本稿では、新しい損失項を通じて未ラベルデータの局所的およびグローバルな一貫性を強制することにより、少数ショット分類を向上させる半教師あり少数ショット学習手法である一貫性プロトタイプネットワーク(CPN)を提案する。CPNは最先端の性能を達成し、mini-ImageNetの5ショットで70.1%の正確度を達成し、ラベルの40%しか使用しなくても、完全に教師ありのプロトタイプネットワークを上回る性能を発揮する。

ABSTRACT

Learning from a few examples is a key characteristic of human intelligence that AI researchers have been excited about modeling. With the web-scale data being mostly unlabeled, few recent works showed that few-shot learning performance can be significantly improved with access to unlabeled data, known as semi-supervised few shot learning (SS-FSL). We introduce a SS-FSL approach that we denote as Consistent Prototypical Networks (CPN), which builds on top of Prototypical Networks. We propose new loss terms to leverage unlabelled data, by enforcing notions of local and global consistency. Our work shows the effectiveness of our consistency losses in semi-supervised few shot setting. Our model outperforms the state-of-the-art in most benchmarks, showing large improvements in some cases. For example, in one mini-Imagenet 5-shot classification task, we obtain 70.1% accuracy to the 64.59% state-of-the-art. Moreover, our semi-supervised model, trained with 40% of the labels, compares well against the vanilla prototypical network trained on 100% of the labels, even outperforming it in the 1-shot mini-Imagenet case with 51.03% to 49.4% accuracy. For reproducibility, we make our code publicly available.

研究の動機と目的

  • 大規模な未ラベルデータを半教師あり設定で活用することで、少数ショット学習の性能を向上させること。
  • 少数ショット学習におけるラベル付きデータの限界を補うために、未ラベル例を効果的に統合すること。
  • 埋め込み空間における局所的近傍とグローバルな特徴分布の両方の一致を維持する手法を開発すること。
  • 顕著に少ないラベル例を使用しながら、完全に教師ありのモデルと同等またはそれ以上の性能を達成すること。
  • コードを公開することで再現可能性を確保すること。

提案手法

  • 未ラベルデータを活用するための新しい損失項をプロトタイプネットワークに拡張する。
  • 埋め込み空間における近接するサンプルの特徴が類似するよう促す局所的一貫性損失を導入する。
  • モデルの予測と特徴の全体的分布との整合性を促すグローバル一貫性損失を実装する。
  • メタラーニングフレームワークを用いて、少数ショットエピソードに適応するための組み合わせ損失を最適化する。
  • ラベル付きおよび未ラベル付きデータに基づいて更新されるクラスプロトタイプを用いたプロトタイプベースの分類ヘッドを採用する。
  • 一貫性正則化を適用して、低ショット状況における一般化性能を向上させる。

実験結果

リサーチクエスチョン

  • RQ1未ラベルデータに対して局所的およびグローバルな一貫性を強制することで、少数ショット分類の性能が向上するか?
  • RQ2完全な教師あり学習と比較して、ラベルの40%しか使用しなくても、どの程度の向上が達成できるか?
  • RQ3一貫性損失を用いた半教師あり学習が、低ショット状況下で完全に教師ありのプロトタイプネットワークを上回るか?
  • RQ4一貫性正則化が、ラベル付きデータが限られた状況下での少数ショット学習の安定性と一般化性能を向上させられるか?
  • RQ5提案手法は、複数のベンチマークにおいて最先端の手法と比較してどのように評価されるか?

主な発見

  • CPNは、mini-ImageNetの5ショット分類ベンチマークで70.1%の正確度を達成し、以前の最先端の64.59%を上回った。
  • ラベルの40%しか使用しなくても、CPNは完全に教師ありのプロトタイプネットワークを上回り、1ショット設定で51.03%の正確度を達成したのに対し、ベースラインは49.4%であった。
  • 未ラベルデータの有効な活用のおかげで、特に5ショット設定において、低ショット状況で顕著な向上が見られた。
  • 局所的一貫性損失とグローバル一貫性損失の組み合わせにより、より頑健で一般化可能な特徴表現が得られた。
  • 複数のベンチマークで強力な性能を発揮したため、広範な適用可能性が示された。
  • コードが公開されたため、再現性が確保され、今後の研究が促進された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。