QUICK REVIEW

[論文レビュー] Free Lunch for Few-shot Learning: Distribution Calibration

Shuo Yang, Lu Liu|arXiv (Cornell University)|Jan 16, 2021

Domain Adaptation and Few-Shot Learning参考文献 34被引用数 174

ひとこと要約

本論文は、特徴空間において基底クラスの統計を few-shot の新規クラスへ転送する、単純でパラメータ不要の分布補正戦略を提案する。これによりサンプルされた特徴量が分類器の学習を改善できる。これらの較正特徴量で訓練したロジスティック回帰モデルは、複数のデータセットで最先端の結果を達成する。

ABSTRACT

Learning from a limited number of samples is challenging since the learned model can easily become overfitted based on the biased distribution formed by only a few training examples. In this paper, we calibrate the distribution of these few-sample classes by transferring statistics from the classes with sufficient examples, then an adequate number of examples can be sampled from the calibrated distribution to expand the inputs to the classifier. We assume every dimension in the feature representation follows a Gaussian distribution so that the mean and the variance of the distribution can borrow from that of similar classes whose statistics are better estimated with an adequate number of samples. Our method can be built on top of off-the-shelf pretrained feature extractors and classification models without extra parameters. We show that a simple logistic regression classifier trained using the features sampled from our calibrated distribution can outperform the state-of-the-art accuracy on two datasets (~5% improvement on miniImageNet compared to the next best). The visualization of these generated features demonstrates that our calibrated distribution is an accurate estimation.

研究の動機と目的

多-shot 基底クラスの統計を用いて特徴空間の分布を較正することで、few-shot 学習における過剰適合と分布の偏りに対処する。
新規クラスの較正平均と共分散を推定するためのガウス特徴モデルベースの転移機構を提案する。
追加の学習可能パラメータなしで特徴をガウシアン化し、拡張サンプルを生成するために Tukey’s Ladder of Powers 変換を活用する。
較正サンプルで学習した単純なロジスティック回帰（または線形分類器）が最先端手法を上回ることを示す。
追加のパラメータ学習なしで、複数のデータセットとバックボーンにわたる手法の頑健性を示す。

提案手法

各特徴次元がクラスごとにガウス分布に従うと仮定し、クラス間の類似性に基づいて基底クラスの統計を新規クラスへ転送する。
較正前に Tukey’s Ladder of Powers 変換を用いて特徴をガウシアン化する。
各サポート特徴量について、平均距離で k 最近傍の基底クラスを同定し、そのサンプルの較正平均と共分散を計算する。
最近傍基底統計から各新規クラスの較正分布集合を構築し、これらの分布から追加の特徴をサンプルする。
元の（変換後の）サポート特徴量と生成特徴の両方でクロスエントロピー損失を用いて分類器を訓練する；新たな学習可能パラメータは導入しない。

実験結果

リサーチクエスチョン

RQ1追加の学習可能パラメータを学習せずに、分布のバイアスを緩和することで分布補正は few-shot 学習を改善できるか？
RQ2特徴空間のガウス仮定を用いて基底クラスの統計を新規クラスへどの程度転送できるか？
RQ3Tukey の変換と生成サンプル数が few-shot 精度に与える影響は？
RQ4提案手法は異なるデータセットとバックボーンでどのように性能を示すか？
RQ5較正・増強特徴で訓練した場合、単純な線形分類器は十分か？

主な発見

calibrated features を用いた単純な分類器で、mini ImageNet、tiered ImageNet、CUB の 5-way 1-shot および 5-shot 精度を改善。
較正された分布はテスト分布をより適切にカバーする特徴を生み出し、可視化と精度の向上で示される。
較正・増強特徴で訓練したロジスティック回帰や SVM は、追加の学習可能パラメータを要さず、いくつかの最先端手法を上回る。
Tukey’s変換（λ が約 0.5）と生成特徴を組み合わせると、最良のアブレーション性能を達成。
校正はバックボーンを超えて頑健で、さまざまなベースラインの上に適用して性能を向上させることができる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。