Skip to main content
QUICK REVIEW

[論文レビュー] Meta-Prod2Vec - Product Embeddings Using Side-Information for Recommendation

Flavian Vasile, Elena Smirnova|arXiv (Cornell University)|Jul 25, 2016
Music and Audio Processing参考文献 30被引用数 118
ひとこと要約

Meta-Prod2Vec は Prod2Vec を強化し、トレーニング時情報としてアイテムのメタデータを取り入れることで、レコメンデーションのためのアイテム埋め込みを改善し、特にコールドスタート時の性能を向上させる。

ABSTRACT

We propose Meta-Prod2vec, a novel method to compute item similarities for recommendation that leverages existing item metadata. Such scenarios are frequently encountered in applications such as content recommendation, ad targeting and web search. Our method leverages past user interactions with items and their attributes to compute low-dimensional embeddings of items. Specifically, the item metadata is in- jected into the model as side information to regularize the item embeddings. We show that the new item representa- tions lead to better performance on recommendation tasks on an open music dataset.

研究の動機と目的

  • オンラインのメモリ要件を増やすことなく、アイテムのメタデータを活用して推奨性能を改善する動機づけ。
  • Prod2Vec を拡張してサイド情報を取り込むことで、より良いアイテム表現を得る。
  • 特にコールドスタート・レジームでメタデータが次イベント予測に与える影響を評価する。
  • 公開データセットで Meta-Prod2Vec が Prod2Vec および CF ベースラインと比較した場合の比較を示す。

提案手法

  • ニューラルモデルの入力と出力空間の両方にメタデータを注入することで Prod2Vec を拡張する。
  • メタデータとの4つの相互作用項を導入する: L_I|M, L_J|M, L_M|I, L_M|M それぞれの正則化ウェイトとともに。
  • 共有埋め込み空間と、Prod2Vec 損失とサイド情報損失を組み合わせた訓練目的を使用する: L_MP2V = L_J|I + λ*(L_M|I + L_J|M + L_M|M + L_I|M)。
  • Word2Vec に近いネガティブサンプリングを用いたスケーラブルな訓練 regime を採用してソフトマックスを近似。
  • オンラインメモリのフットプリントを変更せず、メタデータは訓練時のみ使用する。

実験結果

リサーチクエスチョン

  • RQ1Meta-Prod2Vec は metadata が利用可能な場合、Prod2Vec よりも次のアイテム予測を改善しますか?
  • RQ2各タイプのサイド情報は性能向上にどの程度寄与しますか?
  • RQ3コールドスタートのシナリオで Meta-Prod2Vec はベースラインと比べてどのような影響を与えますか?
  • RQ4Meta-Prod2Vec を CF メソッドと組み合わせて推奨をさらに改善できますか?

主な発見

手法HR@10NDCG@10HR@20NDCG@20
BestOf0.0003 (0.0002;0.0003)0.001 (0.001;0.001)0.0003 (0.0002;0.0003)0.002 (0.002;0.002)
CoCounts0.0248 (0.0245;0.0251)0.122 (0.121;0.123)0.0160 (0.0158;0.0161)0.141 (0.139;0.142)
Prod2Vec0.0170 (0.0168;0.0171)0.105 (0.103;0.106)0.0101 (0.0100;0.0102)0.113 (0.112;0.115)
Meta-Prod2Vec0.0191 (0.0189;0.0194)0.110 (0.108;0.113)0.0124 (0.0123;0.0126)0.125 (0.123;0.126)
Mix(Prod2Vec,CoCounts)0.0273 (0.027;0.0276)0.140 (0.139;0.141)0.0158 (0.0157;0.0160)0.152 (0.151;0.153)
Mix(Meta-Prod2Vec,CoCounts)0.0292 (0.0288;0.0297)0.144 (0.142;0.145)0.0180 (0.0178;0.0182)0.161 (0.160;0.162)
  • Meta-Prod2Vec は 30Music データセットにおいて HR@10, NDCG@10, HR@20, NDCG@20 で独立した Prod2Vec を上回る。
  • コールドスタートのトラフィックで、Standalone Meta-Prod2Vec はすべてのベースラインを上回り、低カウントのペアに対しては Meta-Prod2Vec と CoCounts のアンサンブルが最良の結果を提供。
  • 各種サイド情報タイプ (I|M, M|I, J|M, M|M) は改善に寄与し、表3 は個々のタイプで最大で Meta-Prod2Vec 全体に対するリフトの 50% に達すると示す。
  • Meta-Prod2Vec は特にクエリ-次アイテム対のゼロ同時出現ケースで顕著なゲインを達成し、コールドスタートシナリオでの一般化能力が向上している。
  • モデルは既存の埋め込みベースのシステムと同じオンラインメモリフットプリントを維持しており、メタデータは訓練時のみ使用される。
  • Mix モデルで CoCounts と組み合わせた場合、Meta-Prod2Vec はテストした構成の中で最も強力な全体性能を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。