[論文レビュー] Sequential Click Prediction for Sponsored Search with Recurrent Neural Networks
この論文では、クリック予測の精度を向上させるために、スパム検索における順序付きユーザー行動をモデル化するRNNベースのフレームワークを提案する。RNNの再帰的構造を用いて広告インプレッション間の時間的依存関係を捉えることで、ロジスティック回帰やフィードフォワードニューラルネットワークといった従来のシーケンスに依存しないモデルよりも顕著に優れた性能を発揮し、大規模な商用検索ログにおいて1.5–2%の絶対的AUC向上を達成した。
Click prediction is one of the fundamental problems in sponsored search. Most of existing studies took advantage of machine learning approaches to predict ad click for each event of ad view independently. However, as observed in the real-world sponsored search system, user's behaviors on ads yield high dependency on how the user behaved along with the past time, especially in terms of what queries she submitted, what ads she clicked or ignored, and how long she spent on the landing pages of clicked ads, etc. Inspired by these observations, we introduce a novel framework based on Recurrent Neural Networks (RNN). Compared to traditional methods, this framework directly models the dependency on user's sequential behaviors into the click prediction process through the recurrent structure in RNN. Large scale evaluations on the click-through logs from a commercial search engine demonstrate that our approach can significantly improve the click prediction accuracy, compared to sequence-independent approaches.
研究の動機と目的
- 既存のクリック予測モデルが各広告インプレッションを独立して扱い、ユーザー行動における時間的依存関係を無視するという限界を是正すること。
- 以前のクリック、滞在時間、クエリ履歴といった順序付きユーザー行動が、将来のクリック確率にどのように影響するかを調査すること。
- 生のクリックログから複雑な順序付き依存関係を自動で学習・活用できるディープラーニングフレームワークを開発すること。
- RNNがスパム検索のクリック予測において長期的および短期的行動パターンをどのようにモデル化できるかを検証すること。
提案手法
- 各ユーザーの広告インプレッション履歴を、クエリ、広告テキスト、クリック状況、滞在時間などの特徴を含む時系列順のシーケンスとしてモデル化する。
- 再帰状態を備えた再帰的ニューラルネットワーク(RNN)を用い、インプレッション間を跨いで順序情報の蓄積を可能にし、時間的依存関係の学習を可能にする。
- 短いスパンの依存関係を明示的にモデル化するため、時間による逆誤差伝搬(BPTT)を用いてRNNを訓練する。
- 推論時においてもシーケンス間で再帰状態を保持することで、予測中に歴史的文脈を維持し、順序付きモデリングを確保する。
- 各広告インプレッションのクリック確率を予測するため、RNNの出力を最終分類器(例:ソフトマックスまたはシグモイド)と統合する。
- 商用検索エンジンのタイムスタンプ付きログを用いて、実世界の関連性を持つ訓練用およびテスト用シーケンスを構築する。
実験結果
リサーチクエスチョン
- RQ1以前のクリックや滞在時間といったユーザー行動の時間的依存関係が、将来の広告クリック確率にどのように影響するか。
- RQ2RNNはスパム検索のクリック行動における長期的および短期的順序付き依存関係を効果的にモデル化できるか。
- RQ3順序付き履歴を組み込むことで、シーケンスに依存しないモデルと比較してクリック予測の精度がどの程度向上するか。
- RQ4RNNモデルの性能は、訓練時の履歴シーケンス長やアンフォールディングステップ数に対してどの程度感受性を示すか。
主な発見
- RNNモデルは、ロジスティック回帰やフィードフォワードニューラルネットワークといったベースラインモデルと比較して、大規模な商用クリックログにおいて1.5–2%の絶対的AUC向上を達成した。
- 推論時に再帰状態を削除すると、AUCは89.75%から88.25%に低下し、順序付き記憶が性能に不可欠であることが確認された。
- 履歴シーケンスが長くなるほど性能が向上し、蓄積期間が延長するほど、RNNはベースラインモデルよりも相対的に高い向上を示した。
- BPTTにおける最適なアンフォールディングステップ数は3であり、これ以上になると消失勾配により性能が低下し、モデルの深さと安定性のトレードオフが示された。
- RNNはアンフォールディングによる短いスパンの依存関係と、再帰的重みによる長いスパンの依存関係の両方を効果的に捉えており、その強力な性能の背景にある。
- 稀なケースであっても、履歴データが限られている状況でもRNNは優れた性能を維持しており、スパースなシーケンスに対してもロバストであることが示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。