QUICK REVIEW

[論文レビュー] Affinity and Diversity: Quantifying Mechanisms of Data Augmentation

Raphael Gontijo-Lopes, Sylvia Smullin|arXiv (Cornell University)|Feb 20, 2020

Domain Adaptation and Few-Shot Learning参考文献 58被引用数 53

ひとこと要約

この論文は、モデル依存の指標として Affinity と Diversity を導入し、データ拡張が汎化に与える影響を定量化し、最適な拡張が両方のバランスを取り、効果的な訓練データセットサイズを増やすことを示す。訓練中に拡張をオフにするとパフォーマンスをさらに向上させることがある。

ABSTRACT

Though data augmentation has become a standard component of deep neural network training, the underlying mechanism behind the effectiveness of these techniques remains poorly understood. In practice, augmentation policies are often chosen using heuristics of either distribution shift or augmentation diversity. Inspired by these, we seek to quantify how data augmentation improves model generalization. To this end, we introduce interpretable and easy-to-compute measures: Affinity and Diversity. We find that augmentation performance is predicted not by either of these alone but by jointly optimizing the two.

研究の動機と目的

データ拡張が分布シフトのヒューリスティックを越えて汎化をどのように改善するべきか理解する必要性を動機づける。
拡張効果を定量化する解釈可能な指標（Affinity と Diversity）を提案する。
CIFAR-10 と ImageNet の大規模な拡張の集合を評価して、これらの指標とパフォーマンスの関係を明らかにする。
Affinity と Diversity を組み合わせることで、いずれの指標単独よりも拡張の利点をよりよく説明できることを示す。
拡張スケジューリングの役割と正則化効果との関係を調査する。

提案手法

Affinity を、拡張済み検証データでの正確さとクリーン検証データでの正確さの差として定義する。
Diversity を、訓練データの確率的拡張の下での期待訓練損失として定義する。
動的拡張と単一変換ベースラインを用いた大規模な実験を行う（CIFAR-10 で 204、ImageNet で 223）。
拡張の性能を Affinity–Diversity 平面と比較して最終的なテスト精度を予測する。
訓練中途で拡張をオフにする効果（Switch-off Lift）を分析して訓練を加速し最終精度を改善する。

実験結果

リサーチクエスチョン

RQ1Affinity および Diversity はそれぞれ拡張に起因するパフォーマンス向上とどのように関連しているか？
RQ2拡張は、Affinity と Diversity の両方を同時に最適化したときに最も良い性能を発揮するか？
RQ3訓練の途中で拡張をオフにすると最終性能を改善できるか、またどの条件下でそうなるか？
RQ4データセット全体にわたって拡張の利点には、効果的な訓練データ数（多様性）の増加が必須か？
RQ5静的拡張と動的拡張は性能と多様性にどう影響するか？],
RQ6key_findings([

主な発見

パフォーマンスは Affinity または Diversity のみでは決まらない。最適な拡張方針は両方の指標を共同で最大化することにある。
より高い Diversity は固定された Affinity でより良い精度と相関があるのが一般的で、より高い Affinity は与えられた Diversity でのパフォーマンスを一般的に支援する。
拡張の利点は、総訓練例数を増やすことに結びついており、静的拡張は動的拡張よりも劣る。
訓練中に拡張をオフに切り替えると“Switch-off Lift”を生むことがあり、場合によってはクリーンなベースラインを上回る。
拡張の利点は他の正則化手段と共通点を持ち、正則化をオフにするタイミングが訓練を加速し最終精度を改善する。
CIFAR-10 と ImageNet を横断して、Affinity と Diversity の組み合わせは、いずれかの指標単独より拡張の有用性をより明確に予測できる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。