QUICK REVIEW

[論文レビュー] When Unsupervised Domain Adaptation Meets Tensor Representations

Hao Lü, Lei Zhang|arXiv (Cornell University)|Jul 19, 2017

Domain Adaptation and Few-Shot Learning参考文献 39被引用数 25

ひとこと要約

本稿では、ベクトル化を経由せずに、ソースドメインおよびターゲットドメインのテンソル表現を直接適応する、新しい非教師ありドメイン適応手法であるテンソル整合不変部分空間学習（TAISL）を提案する。整合行列を学習してテンソルを共有の不変テンソル部分空間に射影することにより、TAISLは多次元構造を保持し、次元削減を実現し、特に深層畳み込みニューラルネットワークの活性化において、最先端手法を上回る性能を示す。また、ラベルノイズや少数サンプル設定に対しても高いロバスト性を示す。

ABSTRACT

Domain adaption (DA) allows machine learning methods trained on data sampled from one distribution to be applied to data sampled from another. It is thus of great practical importance to the application of such methods. Despite the fact that tensor representations are widely used in Computer Vision to capture multi-linear relationships that affect the data, most existing DA methods are applicable to vectors only. This renders them incapable of reflecting and preserving important structure in many problems. We thus propose here a learning-based method to adapt the source and target tensor representations directly, without vectorization. In particular, a set of alignment matrices is introduced to align the tensor representations from both domains into the invariant tensor subspace. These alignment matrices and the tensor subspace are modeled as a joint optimization problem and can be learned adaptively from the data using the proposed alternative minimization scheme. Extensive experiments show that our approach is capable of preserving the discriminative power of the source domain, of resisting the effects of label noise, and works effectively for small sample sizes, and even one-shot DA. We show that our method outperforms the state-of-the-art on the task of cross-domain visual recognition in both efficacy and efficiency, and particularly that it outperforms all comparators when applied to DA of the convolutional activations of deep convolutional networks.

研究の動機と目的

教師なしターゲットデータに依存せずに、視覚認識におけるドメインシフトを解消するため、ソースドメインのデータをターゲットドメインの分布に適応すること。
ベクトル化の過程で構造的情報を損なうだけでなく、次元の呪いに苦しむ、従来のベクトルベースのドメイン適応手法の限界を克服すること。
深層ネットワークからの畳み込み特徴など、高次元テンソル表現に内在する内在的な多次元線形関係を、ドメイン適応の過程で保持すること。
適応行列と不変テンソル部分空間を同時に学習する共同最適化フレームワークを構築し、効果的かつ効率的な適応を実現すること。
特に少数サンプルおよびワンショット適応設定において、最先端手法を上回る効果性と効率性を示すこと。

提案手法

本手法は、ベクトル化を回避するため、ソースおよびターゲットのテンソル表現を直接モデル化するテンソル整合不変部分空間学習（TAISL）フレームワークを導入する。
ソーステンソルをターゲットドメインに整合した共有の不変テンソル部分空間に射影するための、一連の整合行列を学習する。
ドメインの不一致を最小化するために、最適化のための交互最小化スキームを用いて、整合行列と不変テンソル部分空間を共同で最適化する。
テンソルモード（例えば、空間的、チャネル、バッチ）ごとの部分的適応を実行することで、次元削減を実現し、次元の呪いを回避する。
最適化問題は、判別的特徴を保持するとともに、ドメイン間の分布シフトを最小化するように定式化される。
本手法は3次テンソル（例えば、CNNの特徴マップ）に適用され、複数のモードにおける相関関係を同時にモデル化する。

実験結果

リサーチクエスチョン

RQ1ベクトル化手法と比較して、テンソル表現の直接的適応はドメイン適応性能を向上させるか？
RQ2テンソルにおける多次元構造の保持は、ラベルノイズや少数サンプル設定に対するロバスト性を向上させるか？
RQ3テンソル部分空間におけるモードごとの適応は、包括的なベクトルベースの適応と比較して、計算複雑性と推定誤差を低減できるか？
RQ4自然にテンソル構造を持つ深層畳み込み特徴において、本手法はどのように性能を発揮するか？
RQ5適応行列と不変部分空間の共同最適化は、さまざまなハイパーパrameter設定において効果的かつ安定的か？

主な発見

Office-Caltech10データセットにおいて、TAISLはすべての最先端手法を上回り、tCONV特徴を用いたW→Cタスクで76.4%の精度を達成した。これに対して、2番目に優れた手法（NTSL）は71.6%であった。
ImageNet-VOC2007データセットでは、TAISLがtCONV特徴を用いて60.4%のmAPを達成し、2番目に優れた手法（NTSL）を5.2ポイント上回った。
本手法はラベルノイズや少数サンプル設定に対してもロバストであり、10回の試行において安定した性能を示し、標準偏差も低かった（例：ImageNet-VOC2007のmAPで3.5）。
感度分析の結果、分類精度は重み係数λの変化に対してほとんど感受性がなく、λを1e-9から1e1の範囲で変化させても最小限の変動にとどまった。
空間的モードの次元（ds）を増加させることで精度が向上し、空間的構造の保持が適応性能を向上させることを示している。
特徴モードの次元（df）には飽和効果が見られた：df=16まで精度は顕著に向上するが、それ以上になると変化が止まり、表現力と複雑さの最適なバランスが得られていることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。