Skip to main content
QUICK REVIEW

[論文レビュー] Unsupervised Deep Learning by Neighbourhood Discovery

Jiabo Huang, Qi Dong|arXiv (Cornell University)|Apr 25, 2019
Advanced Image and Video Retrieval Techniques被引用数 68
ひとこと要約

AND は、個々のサンプルにアンカーを据えたクラス一貫の局所近隣を段階的に発見することで識別的特徴を学習する教師なし手法であり、ラベルなしでエンドツーエンド訓練を可能にする Anchor Neighbourhood Discovery を提案する。

ABSTRACT

Deep convolutional neural networks (CNNs) have demonstrated remarkable success in computer vision by supervisedly learning strong visual feature representations. However, training CNNs relies heavily on the availability of exhaustive training data annotations, limiting significantly their deployment and scalability in many application scenarios. In this work, we introduce a generic unsupervised deep learning approach to training deep models without the need for any manual label supervision. Specifically, we progressively discover sample anchored/centred neighbourhoods to reason and learn the underlying class decision boundaries iteratively and accumulatively. Every single neighbourhood is specially formulated so that all the member samples can share the same unseen class labels at high probability for facilitating the extraction of class discriminative feature representations during training. Experiments on image classification show the performance advantages of the proposed method over the state-of-the-art unsupervised learning models on six benchmarks including both coarse-grained and fine-grained object image categorisation.

研究の動機と目的

  • ラベル付きデータを超えてスケールする教師なし学習を動機づけ、局所的なクラス一貫の近隣を発見する。
  • クラスタリングとサンプル特異性の利点を組み合わせつつ、それらの弱点を緩和するために Anchor Neighbourhood Discovery (AND) を導入する。
  • 学習中のクラス一貫性を最大化するために、カリキュラムベースの段階的な近隣発見を開発する。
  • 近隣監督損失を備えたエンドツーエンドで微分可能な学習フレームワークを提供する。
  • 複数の粗・細分類の画像認識ベンチマークで最先端の性能を示す。

提案手法

  • 各サンプルにアンカー近隣を据えた k-最近傍集合を定義し、近接性は未見のクラスラベルの共有を意味すると仮定する。
  • 非パラメトリックなソフトマックス交差エントロピー損失を用いて、各サンプルを自分自身のクラスとして扱うインスタンス特異的監視で初期化する。
  • 近隣の類似度の差異を微分可能な近傍類似度の集約を用いて、近隣内のラベル一貫性を促進する近隣監督損失を導入する。
  • 類似度分布のエントロピーに基づき、R回の段階でよりクラス一貫性の高い近隣を段階的に選択するカリキュラム学習を採用する。
  • 反復を横断して安定した近隣発見を可能にするため、指数移動平均で特徴メモリを更新する。
  • インスタンスレベルと近隣レベルの損失を結合した結合目的関数を、微分可能なエンドツーエンド学習ループで最適化する。

実験結果

リサーチクエスチョン

  • RQ1手動ラベルなしで局所的でクラス一貫の近隣は信頼できる監督信号を深層学習に提供できるか。
  • RQ2近隣発見の進行型カリキュラムは、一発の近隣発見戦略や純粋なインスタンスレベル学習と比較して学習表現の品質を向上させるか。
  • RQ3AND は標準ベンチマークを横断してクラスタリング、自己教師あり、およびインスタンスベースの教師なし手法とどのように比較されるか。
  • RQ4近隣サイズ、ネットワーク容量、カリキュラム回数は学習特徴の質にどのような影響を及ぼすか。

主な発見

  • AND は複数のベンチマーク(例:CIFAR10、CIFAR100、SVHN、ImageNet、および細分類データセット)で、いくつかの最先端手法と比較してしばしば優れた教師なし表現学習を達成する。
  • より小さな近隣(k=1)はクラス一貫性の高い近隣を得やすく、性能が向上する傾向がある。
  • 進行的な近隣発見のカリキュラム(R回にわたる)は、ワンショットの近隣発見戦略より学習を改善する。
  • より強いネットワークバックボーン(例:ResNet系)とより良い初期化はANDの性能を高める。
  • 本手法は追加の後処理なしでkNNベースの分類を直接改善する識別的特徴を生み出す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。