QUICK REVIEW

[論文レビュー] Unsupervised Embedding Learning via Invariant and Spreading Instance Feature

Mang Ye, Xu Zhang|arXiv (Cornell University)|Apr 6, 2019

Domain Adaptation and Few-Shot Learning参考文献 52被引用数 80

ひとこと要約

本論文は、Siameseネットワークで訓練されたインスタンスごとのソフトマックス埋め込みを導入し、教師なし埋め込みのためのデータ拡張に不変でインスタンス分散を促す特徴を学習し、見たカテゴリと未見カテゴリの両方で速い収束と高い性能を達成する。

ABSTRACT

This paper studies the unsupervised embedding learning problem, which requires an effective similarity measurement between samples in low-dimensional embedding space. Motivated by the positive concentrated and negative separated properties observed from category-wise supervised learning, we propose to utilize the instance-wise supervision to approximate these properties, which aims at learning data augmentation invariant and instance spread-out features. To achieve this goal, we propose a novel instance based softmax embedding method, which directly optimizes the `real' instance features on top of the softmax function. It achieves significantly faster learning speed and higher accuracy than all existing methods. The proposed method performs well for both seen and unseen testing categories with cosine similarity. It also achieves competitive performance even without pre-trained network over samples from fine-grained categories.

研究の動機と目的

ラベルなしで判別可能な埋め込みを学習するためにインスタンスごとの監視を活用する動機付け。
データ拡張中の同一インスタンスの不変性を強制しつつ、異なるインスタンスの特徴を分散させる。
埋め込み特徴を直接最適化する効率的なインスタンス特徴ベースのソフトマックス型の定式化を開発する。
見 seen/unseen カテゴリを含む標準的な教師なし埋め込みベンチマークでの性能を向上させることを示す。

提案手法

実際のインスタンス特徴を直接最適化するインスタンス特徴ベースのソフトマックス埋め込みを提案する（分類器の重みやメモリバンクではなく）。
各インスタンスに対してランダムなデータ拡張を用い、同一インスタンスに対する拡張不変性を課す。
小さなバッチ方式を採用し、m個のインスタンスをサンプリングしてSiameseネットワークを用いた二値分類ビューとして扱う。
確率P(i|x̂i)とP(i|xj)を、インスタンス特徴と拡張特徴の内積に基づき温度パラメータτの下で定義する。
すべてのバッチ内のインスタンスについて、P(i|x̂i)と1−P(i|xj)を組み合わせた負対数尤度Jを最小化し、拡張不変性と分散性を実現する。
P(i|x̂i)を最大化し、P(i|xj)を最小化することが、インスタンス内の不変性とインスタンス間の分散を促進する理論的根拠を提供する。

実験結果

リサーチクエスチョン

RQ1インスタンスごとの監視は、ラベルなし設定で判別可能な埋め込みを学習する際にカテゴリレベルのラベルの代替となり得るか？
RQ2データ拡張の不変性とインスタンスの分散性は、見たカテゴリと未見カテゴリの埋め込み品質を共同で向上させるか？
RQ3ソフトマックス型直接最適化でインスタンス特徴を直接最適化することは、重みやメモリベースの方法よりも収束を速め、精度を向上させるか？
RQ4学習した埋め込みは、細分類データセットで未見カテゴリにどの程度一般化するか？

主な発見

CIFAR-10とSTL-10における教師なし埋め込み手法のkNNおよび線形評価で最先端の性能を達成。
学習速度が速く、より早い段階で高い精度を達成（例：CIFAR-10のkNNで128次元埋め込みで83.6%）し、競合他社よりも競争力のある精度に到達するために必要なエポック数が少ない。
実際のインスタンス特徴を直接最適化することで exemplar-classifier および memory-bank softmax などのVariantsを上回る。
CUB200、Product、Car196データセットで未見カテゴリへ強い一般化を示し、検索（R@K）とクラスタリング（NMI）指標で競合または優位。
アブレーション研究でデータ拡張（特に RandomResizedCrop）とハードネガティブ戦略の両方が性能向上に重要であることを確認。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。