[論文レビュー] Feature Transfer Learning for Deep Face Recognition with Under-Represented Data
本稿では、少数の訓練サンプルを持つ過小代表化(UR)クラスに起因するバイアスを受ける深層顔認識分類器に対処するため、センターに基づく特徴転送学習(FTL)フレームワークを提案する。特徴空間において、通常の(well-represented)クラスからURクラスへ主成分分散を転送することで、FTLはクラス内多様性を豊かにしながらもアイデンティティを保持する。交互に最適化する訓練戦略により、意思決定境界の公平性と特徴の識別性の両方を向上させ、LFW、IJB-A、MS-Celeb-1Mで最先端の性能を達成する。
Despite the large volume of face recognition datasets, there is a significant portion of subjects, of which the samples are insufficient and thus under-represented. Ignoring such significant portion results in insufficient training data. Training with under-represented data leads to biased classifiers in conventionally-trained deep networks. In this paper, we propose a center-based feature transfer framework to augment the feature space of under-represented subjects from the regular subjects that have sufficiently diverse samples. A Gaussian prior of the variance is assumed across all subjects and the variance from regular ones are transferred to the under-represented ones. This encourages the under-represented distribution to be closer to the regular distribution. Further, an alternating training regimen is proposed to simultaneously achieve less biased classifiers and a more discriminative feature representation. We conduct ablative study to mimic the under-represented datasets by varying the portion of under-represented classes on the MS-Celeb-1M dataset. Advantageous results on LFW, IJB-A and MS-Celeb-1M demonstrate the effectiveness of our feature transfer and training strategy, compared to both general baselines and state-of-the-art methods. Moreover, our feature transfer successfully presents smooth visual interpolation, which conducts disentanglement to preserve identity of a class while augmenting its feature space with non-identity variations such as pose and lighting.
研究の動機と目的
- 過小代表化(UR)クラスに少ないサンプルがある場合に生じる不均衡な訓練データに起因する深層顔認識分類器のバイアスを是正すること。
- データ量を減らさずにURクラスの特徴空間を強化し、クラス内多様性を促進する手法を開発すること。
- 交互最適化により、同時に分類器のバイアス低減と特徴の識別性向上を実現する訓練戦略を設計すること。
- 転送された特徴分散を活用することで、低ショットおよびワンショット認識のシナリオへの有効な一般化を可能にすること。
提案手法
- センターに基づく特徴転送モジュールは、通常クラスから推定された主成分分散を用いて、URクラスの合成特徴サンプルを生成する。
- 本手法は、すべてのクラスに共通のガウス事前分布を仮定し、クラス固有の平均と共有される分散を持つ。これにより、アイデンティティ以外の変化(例:ポーズ、照明)を転送しつつ、アイデンティティを保持できる。
- エンコーダーを固定して特徴転送を行うことで意思決定境界を再形状し、次に分類器を固定して特徴表現を精緻化する、交互に二段階の訓練戦略を採用する。
- 特徴の凝縮性と一般化性能を向上させるために、特徴転送機構とは直交する新たなm-L2正則化を導入する。
- デコーダーネットワークを用いて特徴の補間と転送を可視化し、アイデンティティ成分と非アイデンティティ成分の分離を可能にする。
- センターと分散の成分を別々に用いて、アイデンティティ変化と非アイデンティティ変化の両方の補間を実行し、滑らかな視覚的遷移を実現する。
実験結果
リサーチクエスチョン
- RQ1通常クラスから過小代表化クラスへの特徴転送は、深層顔認識における分類器バイアスを低減できるか?
- RQ2データ量やアイデンティティ情報の損失を伴わずに、過小代表化クラスの特徴空間の多様性をどのように豊かにできるか?
- RQ3交互に最適化する訓練戦略は、同時に意思決定境界の公平性と特徴の識別性を向上させられるか?
- RQ4提案手法は、低ショットおよびワンショット顔認識シナリオにどの程度一般化可能か?
- RQ5分離された特徴空間は、アイデンティティと非アイデンティティの変化を分離し、滑らかな視覚的補間を可能にするか?
主な発見
- LFWベンチマークでは、提案されたFTL手法が99.55%の精度を達成し、FaceNet(99.63%)やCosFace(99.73%)といった最先端手法と同等の性能を示した。
- IJB-Aベンチマークでは、ベースライン手法よりも0.6%~2.8%の性能向上を達成し、メトリクス学習(MP + TA)と組み合わせることでさらなる向上が得られた。
- MS-Celeb-1Mのワンショットチャレンジにおいても、競争力ある結果を達成し、低データ環境下での有効性を示した。
- 可視化結果から、アイデンティティは保持されたまま、ポーズ、照明、表情などの非アイデンティティ変化が徐々に転送される滑らかな特徴補間が実現された。
- m-L2正則化は、さまざまな認識タスクにおいて一貫して性能向上をもたらし、特徴転送とは直交する利点を示した。
- 特徴転送により、アイデンティティと非アイデンティティ成分の分離が成功しており、従来の補間法で見られるアーチファクトを回避した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。