Skip to main content
QUICK REVIEW

[論文レビュー] Meta Learning for Few-shot Keyword Spotting.

Yangbin Chen, Tom Ko|arXiv (Cornell University)|Dec 26, 2018
Speech Recognition and Synthesis参考文献 9被引用数 8
ひとこと要約

本稿では、新規クラスと固定クラスを区別するN+M方式分類設定を導入することで、少数ショットキーワードスプライティングに適した修正されたモデルに依存しないメタラーニング(MAML)手法を提案する。Google Speech Commandsデータセットにおける実験では、従来の教師あり学習および標準MAMLよりも優れた性能を発揮した。

ABSTRACT

In this paper, we investigate the feasibility of applying few-shot learning algorithms to a speech task. We formulate a user-defined scenario of spoken term classification as a few-shot learning problem. In most few-shot learning studies, it is assumed that all the N classes are new in a N-way problem. We suggest that this assumption can be relaxed and define a N+M-way problem where N and M are the number of new classes and fixed classes respectively. We propose a modification to the Model-Agnostic Meta-Learning (MAML) algorithm to solve the problem. Experiments on the Google Speech Commands dataset show that our approach outperforms the conventional supervised learning approach and the original MAML.

研究の動機と目的

  • 少数ショット学習を音声タスク、特にキーワードスプライティングに適用可能かどうかを検証すること。
  • すべてのNクラスが新規であるという標準の少数ショット学習の仮定を緩和し、固定クラスと新規クラスを含むハイブリッドN+M方式設定を導入すること。
  • 新規クラスと以前に学習済みのクラスの両方を扱えるようにMAMLを適応させることで、少数ショット音声語句分類の性能を向上させること。
  • 固定クラスを含むメタラーニングが、リソースが限られたキーワード認識において、より良い一般化性能と高速な適応をもたらすことを示すこと。

提案手法

  • キーワードスプライティングタスクを、Nクラスが新規でMクラスが固定(事前に学習済み)であるN+M方式の少数ショット学習問題として定式化する。
  • メタトレーニング中に新規クラスと固定クラスの両方を最適化するようにMAMLアルゴリズムを修正する。
  • エピソードベースのトレーニングを採用し、サポートセットとクエリセットを用いる。サポートセットには新規クラスと固定クラスの両方のサンプルが含まれる。
  • 少数の例で新規クラスに素早く適応できるようにモデルを訓練するが、同時に固定クラスの性能を維持する。
  • エピソード全体にわたって新規クラスと固定クラスの両方の損失を最小化するように、モデルパラメータを更新するメタ最適化プロセスを適用する。
  • 特徴抽出にニューラルネットワークバックボーン(例:CNNまたはRNN)を用い、MAMLによる微調整により高速な適応を実現する。

実験結果

リサーチクエスチョン

  • RQ1リソースが限られた環境下で、少数ショット学習を音声語句分類に効果的に適用できるか?
  • RQ2新規クラス(N)に加えて固定クラス(M)を導入することで、キーワードスプライティングにおける少数ショット適応性能がどのように向上するか?
  • RQ3新規クラスと固定クラスの両方を考慮した修正MAMLアプローチが、標準MAMLおよび教師あり学習を上回る性能を発揮するか?
  • RQ4混合クラスシナリオにおけるメタラーニングの影響は、モデルの一般化性能および推論速度にどのような影響を与えるか?

主な発見

  • 提案されたN+M方式メタラーニングアプローチは、少数ショットキーワードスプライティングにおいて、従来の教師あり学習を上回る高い正確性を達成した。
  • 修正されたMAMLは、Google Speech Commandsデータセットにおける少数ショット評価プロトコルにおいて、元のMAMLアルゴリズムを上回った。
  • メタラーニングで得た初期化のおかげで、少数のサポート例でのみ新キーワードに素早く適応する能力を示した。
  • メタトレーニング時に固定クラスを含めることで、希少または未学習のキーワードに対しても、より高い耐障害性と一般化性能が向上した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。