Skip to main content
QUICK REVIEW

[論文レビュー] Collaborative Recurrent Autoencoder: Recommend while Learning to Fill in the Blanks

Hao Wang, Xingjian Shi|arXiv (Cornell University)|Nov 2, 2016
Recommender Systems and Techniques参考文献 22被引用数 79
ひとこと要約

本稿では、順序付きコンテンツシーケンス(例:記事の見出し、映画のあらまし)の生成とユーザーレーティングの予測を、協調フィルタリングフレームワーク内でのノイズ除去再帰的オートエノード(DRAE)を用いて同時に学習する、新規なハイブリッドレコメンデーションモデル「協調的再帰的オートエノード(CRAE)」を提案する。CRAEは、順序依存性とユーザ-アイテム相互作用を同時にモデル化することで、CiteULikeおよびNetflixデータセットにおいて、推薦およびシーケンス生成の両タスクで最先端の手法を上回る性能を発揮する。

ABSTRACT

Hybrid methods that utilize both content and rating information are commonly used in many recommender systems. However, most of them use either handcrafted features or the bag-of-words representation as a surrogate for the content information but they are neither effective nor natural enough. To address this problem, we develop a collaborative recurrent autoencoder (CRAE) which is a denoising recurrent autoencoder (DRAE) that models the generation of content sequences in the collaborative filtering (CF) setting. The model generalizes recent advances in recurrent deep learning from i.i.d. input to non-i.i.d. (CF-based) input and provides a new denoising scheme along with a novel learnable pooling scheme for the recurrent autoencoder. To do this, we first develop a hierarchical Bayesian model for the DRAE and then generalize it to the CF setting. The synergy between denoising and CF enables CRAE to make accurate recommendations while learning to fill in the blanks in sequences. Experiments on real-world datasets from different domains (CiteULike and Netflix) show that, by jointly modeling the order-aware generation of sequences for the content information and performing CF for the ratings, CRAE is able to significantly outperform the state of the art on both the recommendation task based on ratings and the sequence generation task based on content information.

研究の動機と目的

  • 既存のハイブリッドレコメンデーションシステムが、語順や局所的文脈を無視するbag-of-wordsや固定カーネルCNNをコンテンツモデリングに用いるという限界を是正すること。
  • ノイズ除去オートエノードを非i.i.d.なCFデータに一般化することで、再帰的ニューラルネットワーク(RNN)と協調フィルタリング(CF)の間のギャップを埋めること。
  • シーケンス生成とレーティング予測を同時に最適化する、堅牢でエンドツーエンドのモデルを開発し、正確なレコメンデーションと滑らかなコンテンツ生成を両立させること。
  • 一般化性能とモデルの頑健性を向上させるために、新規な学習可能なプーリング方式と分布に配慮したノイズ除去機構を導入すること。

提案手法

  • CRAEは、ノイズ除去再帰的オートエノード(DRAE)と協調フィルタリングを組み合わせた階層ベイジアン生成モデルを採用し、コンテンツシーケンスとユーザ-アイテムレーティングの両方を同時に学習可能にしている。
  • ノイズを非線形活性化の前段階である隠れ状態に注入する新しいノイズ除去スキームを採用。非線形性は決定論的値ではなく確率分布に適用されるため、モデルの頑健性が向上する。
  • 可変長シーケンスを、時間ステップにわたる隠れ状態を微分可能プーリング操作で集約することで固定長表現に変換する学習可能なプーリング機構を採用。
  • 確率的計算グラフを介したバックプロパゲーションを効率的に行うために、ノイズを含むガウス分布に従う隠れ状態の期待値をシグモイドベースの近似で計算している。
  • エンコーダは、順序依存性を捉えるためにゲート付きRNN(例:GRU型ユニット)を用いて語のシーケンスを処理し、デコーダは元のシーケンスを再構築する。
  • 協調フィルタリング部は、低ランク行列分解を用いてユーザ-アイテム相互作用をモデル化し、シーケンス生成目的と統合するために共同損失関数を用いている。

実験結果

リサーチクエスチョン

  • RQ1再帰的オートエノードは、協調フィルタリング設定に効果的に適応可能であり、ユーザ-アイテムレーティングとコンテンツシーケンス生成を同時にモデル化できるか?
  • RQ2RNNを用いてコンテンツシーケンス内の語順と局所的文脈をモデル化することで、bag-of-wordsや固定カーネルCNNに比べて、より優れたレコメンデーション性能が得られるか?
  • RQ3確率的隠れ状態に適用するノイズ除去スキームは、ハイブリッドレコメンデーションシステムにおける一般化性能と頑健性を向上させられるか?
  • RQ4シーケンス生成とレーティング予測の共同学習は、2段階または別々の訓練アプローチに比べて優れているか?
  • RQ5提案された学習可能なプーリングと分布に配慮した非線形性は、既存の深層生成モデルに比べて性能と学習効率を向上させられるか?

主な発見

  • CRAEは、CiteULikeおよびNetflixデータセットにおいて、推薦およびシーケンス生成の両タスクで最先端のモデルを著しく上回り、M=5におけるrecall@Mが向上している。
  • CiteULikeでは、M=5におけるrecall@Mが0.421に達し、次に優れた手法を5%以上上回る、強力なレコメンデーション性能を示した。
  • Netflixでは、M=5におけるrecall@Mが0.389に達し、大規模かつスパースなレーティングデータでも一貫した性能向上を示した。
  • アブレーションスタディの結果、共同学習が不可欠であることが確認された。λv ≪ 1またはλv ≫ 1の2段階学習に強制した場合、シーケンスモデリングとCFの相乗効果が著しく低下した。
  • 提案された分布に配慮した非線形性は、CDLにおけるレイヤー単位のアプローチに比べ、より安定した学習と高い効率性を実現しており、収束が速く、一般化性能も優れていることが示された。
  • モデルはレーティングのスパarsityに対して頑健である。スパースなレーティングでも高い性能を維持しており、決定論的モデルが著しく性能を落とすのとは対照的である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。