Skip to main content
QUICK REVIEW

[論文レビュー] StarSpace: Embed All The Things!

Ledell Wu, Adam Fisch|arXiv (Cornell University)|Sep 12, 2017
Topic Modeling参考文献 21被引用数 92
ひとこと要約

StarSpace は、離散特徴エンティティを埋め込み、共通空間で比較してラベリング、ランキング、推奨、グラフ埋め込みタスクを行う汎用ニューラル埋め込みモデルです。

ABSTRACT

We present StarSpace, a general-purpose neural embedding model that can solve a wide variety of problems: labeling tasks such as text classification, ranking tasks such as information retrieval/web search, collaborative filtering-based or content-based recommendation, embedding of multi-relational graphs, and learning word, sentence or document level embeddings. In each case the model works by embedding those entities comprised of discrete features and comparing them against each other -- learning similarities dependent on the task. Empirical results on a number of tasks show that StarSpace is highly competitive with existing methods, whilst also being generally applicable to new cases where those methods are not.

研究の動機と目的

  • 多様なドメインを跨ぐラベリング、ランキング、埋め込みタスクを処理できる汎用埋め込みモデルを開発する。
  • StarSpace が複数のタスクで専門手法と競合できることを示す。
  • アウトオブサンプルのエンティティの自然な取り扱いとマルチタイプの比較を実証する。
  • 広範な普及と実験のためのオープンソース実装を提供する。

提案手法

  • 各エンティティを固定辞書からの離散特徴の袋として表現する。
  • 特徴を共有の d 次元空間に埋め込み、特徴埋め込みを合計してエンティティ埋め込みを形成する。
  • 正例と負例の対を弁別するためにネガティブサンプリングを用いたマージンベースの損失で学習する。
  • 損失のランキング/分類の基礎として、類似度関数(コサインまたは内積)を使用する。
  • CPU 上で Adagrad と Hogwild を用いた確率的勾配降下法を適用し、埋め込みの最大ノルム制約を課す。
  • 分類、推奨、知識グラフ連携タスクをカバーする正例/負例ペア (E+, E−) のタスク特化ジェネレータを提供する。

実験結果

リサーチクエスチョン

  • RQ1単一の埋め込みフレームワークは、テキスト分類、文書/文書ランキング、協調フィルタリング/コンテンツベースフィルタリング、知識グラフ埋め込みを効果的に実行できるか?
  • RQ2多様なタスクで、StarSpace がタスク固有のベースライン(例:fastText、TransE、TFIDF、SVM)と比較してどの程度の性能を示すか?
  • RQ3ユーザ/アイテム/ラベルを特徴の袋として特徴付けることで、モデルはアウトオブサンプルのエンティティを自然に取り扱えるか?
  • RQ4負例サンプル数(k)の増減が性能と学習効率に与える影響は何か?

主な発見

  • StarSpace はテキスト分類ベンチマークで fastText と競合する性能を達成し、文書推奨タスクで優れている。
  • Freebase 15k で、StarSpace はリンク予測で TransE と同等の埋め込み次元で一致する。
  • Wikipedia 検索と文の一致では、タスク(文/文書レベル)に直接適応して訓練することで、いくつかのベースラインを上回る。
  • StarSpace は固定IDではなく特徴ベースの表現を介して、ユーザー/アイテムのアウトオブサンプル拡張を可能にする。
  • ネガティブサンプルパラメータ k を増やすと、学習速度と予測性能の間にトレードオフが生じ、時間制限内で特定の範囲が最良の結果をもたらす。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。