Skip to main content
QUICK REVIEW

[論文レビュー] Drop to Adapt: Learning Discriminative Features for Unsupervised Domain Adaptation

Seungmin Lee, Dongwan Kim|arXiv (Cornell University)|Oct 12, 2019
Domain Adaptation and Few-Shot Learning参考文献 52被引用数 30
ひとこと要約

本稿では、特徴空間におけるクラスタ仮説を敵対的ドロップアウトによって強制することで、判別性が高くドメインに依存しない特徴を学習する、新しい非教師ありドメイン適応手法であるDrop to Adapt (DTA) を提案する。全結合層および畳み込み層に対して要素単位およびチャネル単位の敵対的ドロップアウトを適用することにより、DTAは分類境界を密集したターゲット特徴領域から遠ざける。画像分類およびセマンティックセグメンテーションのベンチマークにおいて、ソースのみの学習法や先行SOTA手法と比較して一貫した向上を達成し、最先端の性能を実現する。

ABSTRACT

Recent works on domain adaptation exploit adversarial training to obtain domain-invariant feature representations from the joint learning of feature extractor and domain discriminator networks. However, domain adversarial methods render suboptimal performances since they attempt to match the distributions among the domains without considering the task at hand. We propose Drop to Adapt (DTA), which leverages adversarial dropout to learn strongly discriminative features by enforcing the cluster assumption. Accordingly, we design objective functions to support robust domain adaptation. We demonstrate efficacy of the proposed method on various experiments and achieve consistent improvements in both image classification and semantic segmentation tasks. Our source code is available at https://github.com/postBG/DTA.pytorch.

研究の動機と目的

  • ドメイン対向訓練における限界、すなわちドメインアライメントの過程でクラスラベルを無視することで生じる判別性の低い特徴の生成を是正すること。
  • クラスタ仮説を強制することで非教師ありドメイン適応を改善すること。クラスタ仮説とは、分類境界が特徴空間の低密度領域に位置するべきであるという仮説である。
  • ラベルなしのターゲットデータを必要とせずに、ターゲットドメインにおける特徴の判別性を高める汎用的な正則化技術の開発。
  • 画像分類およびセマンティックセグメンテーションの両タスクにこの手法を拡張し、多様なドメインシフトに対して堅牢であることを示すこと。
  • 既存のディープラーニングアーキテクチャにスムーズに統合できる、シンプルだが効果的なフレームワークの構築。

提案手法

  • 全結合層向けに要素単位の敵対的ドロップアウト(EAdD)と畳み込み層向けにチャネル単位の敵対的ドロップアウト(CAdD)の2種類の敵対的ドロップアウトを提案する。
  • 訓練中にEAdDおよびCAdDを適用し、特徴を摂動させることで、モデルが密集したターゲット特徴クラスタから離れた堅牢な分類境界を学習するように誘導する。
  • クロスエントロピー損失と敵対的ドロップアウト正則化を組み合わせた損失関数を設計し、クラスタ仮説に基づく特徴の判別性を向上させる。
  • VAT(仮想敵対的訓練)とDTAを統合することで、入力空間および特徴空間の両方の正則化を組み合わせ、一般化性能を向上させる。
  • 分類タスクでは最終分類器に、セマンティックセグメンテーションタスクでは中間特徴層にそれぞれこの手法を適用することで、分類およびセグメンテーションの両方をカバーする。
  • 敵対的ドロップアウトが特徴摂動に対するモデルの耐性を最大にするように最適化されるミニマックス訓練戦略を採用する。

実験結果

リサーチクエスチョン

  • RQ1敵対的ドロップアウトは、非教師ありドメイン適応においてクラスタ仮説を効果的に強制するために使用可能か?
  • RQ2特徴抽出器および分類器の両層に敵対的ドロップアウトを適用することで、ターゲットドメインにおける一般化性能が向上するか?
  • RQ3提案手法であるDTAは、異なるデータセットおよびアーキテクチャにおいて、最先端のドメイン適応手法と比較して、性能および耐性面で優れているか?
  • RQ4VAT(仮想敵対的訓練)とDTAを組み合わせることで、モデルの一般化性能およびドメインシフトへの適応性がどの程度向上するか?
  • RQ5DTAフレームワークは、画像分類やセマンティックセグメンテーションといった異なるネットワークアーキテクチャおよびタスクに一般化可能か?

主な発見

  • VisDA-2017ベンチマークにおいて、DTAはResNet-50を用いて93.1%のトップ-1精度を達成し、ResNet-101を用いるともに93.7%を記録。それぞれソースのみのベースライン(46.2%)を著しく上回った。
  • CityscapesからCityscapesへのセマンティックセグメンテーションの適応において、DTAは81.5%の平均IoUを達成。ソースのみのベースライン(50.8%)を上回り、先行SOTA手法をも凌駕した。
  • VATとfDTA・cDTAを組み合わせた場合、ResNet-101では81.2%、ResNet-50では73.1%の精度を達成し、正則化効果が相乗的に働くことが示された。
  • アブレーションスタディの結果、VAT、fDTA、cDTAの各成分が独立に性能向上に寄与しており、特にfDTAは「ナイフ」のような特定クラスに対して強い影響を示した。
  • バックボーンアーキテクチャにかかわらず一貫した向上が得られ、ResNet-50およびResNet-101の両方で効果を示した。これは、モデル容量に依存しない堅牢性を示している。
  • 本手法は、画像分類およびセマンティックセグメンテーションの両タスクで最先端の性能を達成し、複数のベンチマークおよびドメインシフトに対して一貫した向上を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。