QUICK REVIEW

[論文レビュー] Face Recognition via Centralized Coordinate Learning

Xianbiao Qi, Lei Zhang|arXiv (Cornell University)|Jan 17, 2018

Face recognition and analysis参考文献 14被引用数 30

ひとこと要約

本稿では、特徴量を原点に集中させ、分類ベクトルを超球面上に制約することで、顔の特徴量と分類ベクトルを同時に最適化する中央化座標学習（CCL）を提案する。この手法により特徴量の識別性が著しく向上し、CASIA Webfaceからわずか460K枚の画像で学習したにもかかわらず、6つのベンチマーク（クロスエイジおよび大規模データセットを含む）で最先端の性能を達成した。

ABSTRACT

Owe to the rapid development of deep neural network (DNN) techniques and the emergence of large scale face databases, face recognition has achieved a great success in recent years. During the training process of DNN, the face features and classification vectors to be learned will interact with each other, while the distribution of face features will largely affect the convergence status of network and the face similarity computing in test stage. In this work, we formulate jointly the learning of face features and classification vectors, and propose a simple yet effective centralized coordinate learning (CCL) method, which enforces the features to be dispersedly spanned in the coordinate space while ensuring the classification vectors to lie on a hypersphere. An adaptive angular margin is further proposed to enhance the discrimination capability of face features. Extensive experiments are conducted on six face benchmarks, including those have large age gap and hard negative samples. Trained only on the small-scale CASIA Webface dataset with 460K face images from about 10K subjects, our CCL model demonstrates high effectiveness and generality, showing consistently competitive performance across all the six benchmark databases.

研究の動機と目的

トレーニング中に特徴量の分布が不均衡になることが原因で生じる深層顔認識における一般化性能の低さや収束不良の問題を解消すること。
顔の特徴量が原点を中心とする座標空間に広がるようにすることで、特徴量の識別性を向上させること。
分類ベクトルを超球面上に制約することで、コサイン類似度の計算を安定化させること。
適応的角マージン機構を用いてクラス間分離性を向上させること。
限られた学習データでも、特徴量と分類器を統合的に最適化するシンプルなアプローチが強力な性能を発揮することを示すこと。

提案手法

各次元の平均を引くことで顔の特徴量を中央化し、原点を中心に分布させることで、角分離性を向上させる。
分類ベクトルをL2ノルムで正規化し、超球面上に位置させることで、コサイン類似度の計算を一貫したものにする。
特徴量の分布に基づいて動的にマージンを調整する適応的角マージン（AAM）を導入し、クラス間分離性を強化する。
中央化された特徴量学習と正規化された分類ベクトルを統合した共同最適化フレームワークを採用し、学習の収束性と一般化性能を向上させる。
特徴量の中央化と角マージン制約を統合した修正された損失関数を用いた標準的なCNNを採用する。
すべての評価で使用するCASIA Webfaceデータセット（460K枚の画像、約10,000人の被験者）のみを用いた、シンプルで効果的なトレーニングパイプラインを採用する。

実験結果

リサーチクエスチョン

RQ1原点に顔の特徴量を集中させることで、深層顔認識におけるクラス間の角分離性と一般化性能が向上するか？
RQ2分類ベクトルを超球面上に制約することで、トレーニングおよび推論時のコサイン類似度の一貫性が向上するか？
RQ3大規模な学習データを必要とせずに、適応的角マージンがさらに特徴量の識別性を向上させられるか？
RQ4提案されたCCL手法は、はるかに大きなデータセットで学習された最先端モデルと比較してどのように性能を発揮するか？
RQ5特徴量と分類器を統合的に最適化することで、クロスエイジやハードネガティブデータセットを含む多様なベンチマークで優れた性能が得られるか？

主な発見

適応的角マージンを用いたCCLは、LFWベンチマークでSphereFaceを約1%上回り、99.47%の正確性を達成した。
適応的角マージンを用いない場合でも、CCLはLFWで72.572%の正確性を達成し、大きなマージン（m=4）を用いたSphereFace（72.729%）と同等の性能を示した。
CCLは挑戦的なCALFWデータセット（74.5%の正確性）でも競争力のある性能を示し、強力なクロスエイジ一般化性能を示した。
MegaFaceベンチマークでは、大規模なギャラリー集合とアイデンティティの重複がある中でトップ10リtrieval正確性が高く、上位の手法に位置付けられた。
Coco Loss（LFWで76.57%）など、はるかに大きなデータセットで学習されたいくつかの最先端モデルを上回ったが、CCLはCASIA Webfaceのわずか460K枚の画像のみを用いた。
CCLはLFW、CALFW、CACD、SLLFW、YTF、MegaFaceの6つのベンチマークすべてで、最先端または非常に競争力のある結果を一貫して達成した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。