Skip to main content
QUICK REVIEW

[論文レビュー] Compact Nonlinear Maps and Circulant Extensions

Felix X. Yu, Sanjiv Kumar|arXiv (Cornell University)|Mar 12, 2015
Advanced Optimization Algorithms Research参考文献 52被引用数 38
ひとこと要約

本稿では、非線形特徴マップと分類損失を同時に最適化するCompact Nonlinear Maps (CNM)を提案し、マップ次元を大幅に削減しながら最先端の性能を達成している。エンドツーエンドの学習によりマップパラメータを学習し、巡回構造を有する射影行列を用いることで、計算コストとメモリコストをそれぞれO(kd)からO(k log d)およびO(k)に削減するが、ランダム特徴マップと比較して精度を維持または向上させている。

ABSTRACT

Kernel approximation via nonlinear random feature maps is widely used in speeding up kernel machines. There are two main challenges for the conventional kernel approximation methods. First, before performing kernel approximation, a good kernel has to be chosen. Picking a good kernel is a very challenging problem in itself. Second, high-dimensional maps are often required in order to achieve good performance. This leads to high computational cost in both generating the nonlinear maps, and in the subsequent learning and prediction process. In this work, we propose to optimize the nonlinear maps directly with respect to the classification objective in a data-dependent fashion. The proposed approach achieves kernel approximation and kernel learning in a joint framework. This leads to much more compact maps without hurting the performance. As a by-product, the same framework can also be used to achieve more compact kernel maps to approximate a known kernel. We also introduce Circulant Nonlinear Maps, which uses a circulant-structured projection matrix to speed up the nonlinear maps for high-dimensional data.

研究の動機と目的

  • ランダム特徴マップに依存する伝統的なカーネル近似手法の高い計算コストとスケーラビリティの低さに対処すること。
  • 非線形マップと分類器パラメータを同時に学習することで、手動でのカーネル選択の必要性を排除すること。
  • 分類性能を損なわずに非線形特徴マップの次元を低減すること。
  • 巡回構造を有する射影行列を導入することで、高次元データに対する効率性を向上させること。
  • ランダム特徴マップの代替としてスケーラブルでデータ依存的な選択肢を提供し、コンパクトかつ高性能なカーネル近似を実現すること。

提案手法

  • 訓練データから直接非線形特徴マップを学習する共同最適化フレームワークを提案し、分類損失を目的関数として用いる。
  • ランダム特徴マップの枠組みをベースとしつつ、ランダムなパラメータ生成の代わりにマップパラメータをエンドツーエンドで学習する。
  • 巡回行列を用いて計算コストとメモリコストを削減するCirculant Nonlinear Maps (CNM)を導入し、FFTベースの演算を活用する。
  • 分類器重みと巡回射影行列パラメータの両方を最適化するために、交互最小化を採用する。
  • 巡回畳み込みの性質を用いて、巡回行列パラメータの勾配を導出し、O(d log d)の計算量で勾配計算を可能にする。
  • 特徴マップにコサイン非線形関数を用いる:Z(x) = cos(Rx),ここでRは学習可能な巡回行列である。

実験結果

リサーチクエスチョン

  • RQ1エンドツーエンドで最適化された非線形特徴マップは、ランダム特徴マップよりも優れたコンパクト性と性能を達成できるか?
  • RQ2特徴マップと分類器パラメータを同時に最適化することで、手動でのカーネル選択の必要性が排除できるか?
  • RQ3巡回構造を有する射影行列を用いることで、非線形マップの効率性と性能にどのような影響を与えるか?
  • RQ4提案手法は、計算コストとメモリ使用量を大幅に削減しながら、ランダムフーリエ特徴マップと同等またはそれ以上の精度を達成できるか?
  • RQ5このフレームワークは、既知のカーネルのコンパクトなカーネル近似にどの程度応用可能か?

主な発見

  • 最適化されたCNMは、USPS (d) においてわずかk=1000次元で91.96%の精度を達成し、ランダムフーリエ特徴マップ(89.05%)および巡回ランダム(89.40%)を上回った。
  • MNIST (d) において、最適化されたCNMは92.73%の精度に達し、ランダムフーリエ特徴マップ(91.33%)および巡回ランダム(91.01%)を上回った。
  • CIFAR (d) において、最適化されたCNMは71.17%の精度を達成し、巡回ランダム(65.21%)を大きく上回り、ランダムフーリエ特徴マップ(69.14%)と同等の性能を示したが、コストは低減された。
  • 巡回構造により、計算複雑度がO(kd)からO(k log d)、メモリ使用量がO(kd)からO(k)に削減され、高次元データへのスケーラビリティが実現された。
  • 巡回行列最適化マップは、ランダムフーリエ特徴マップとほぼ同一の平均二乗誤差(MSE)を達成しており、優れたカーネル近似品質を裏付けている。
  • このフレームワークにより、カーネル近似と学習を同時に実行でき、データ依存的なマップ学習を通じて分類タスクに最適なカーネルを効果的に発見できる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。