[論文レビュー] Simrank++: Query rewriting through link analysis of the click graph
本稿では、スポンサーリンク広告におけるクエリリライトのフレームワークを強化するためのSimrank++を提案する。従来のSimRankに比べ、クリックグラフからのエッジ重みとエビデンススコアを組み込むことで、リライトの質、カバレッジ、深さを向上させる。重み付きSimrankは5件のリライトで86%の精度を達成し、トップリライトの正確性が96%にのぼり、ベースライン手法を上回る。
We focus on the problem of query rewriting for sponsored search. We base rewrites on a historical click graph that records the ads that have been clicked on in response to past user queries. Given a query q, we first consider Simrank as a way to identify queries similar to q, i.e., queries whose ads a user may be interested in. We argue that Simrank fails to properly identify query similarities in our application, and we present two enhanced version of Simrank: one that exploits weights on click graph edges and another that exploits ``evidence.'' We experimentally evaluate our new schemes against Simrank, using actual click graphs and queries form Yahoo!, and using a variety of metrics. Our results show that the enhanced methods can yield more and better query rewrites.
研究の動機と目的
- 直接の入札が限られる状況において、スポンサーリンク広告における有効なクエリリライトを生成する課題に取り組む。
- クリックグラフの構造的および数量的特徴を考慮することで、標準的なSimRankを改善する。
- 履歴的なクリックパターンと類似度伝搬を活用して、リライトの数と質を向上させる。
- 実世界のYahoo!クリックデータと人間による評価を用いて、強化されたSimRankのバリエーションの有効性を評価する。
- スケーラブルでデータ駆動型のクエリリライト手法を開発し、より良い広告ターゲティングと収益創出を支援する。
提案手法
- クエリと広告を結ぶ二部グラフとしてのクリックグラフに基づき、クエリ類似度をモデル化するためのSimRankの拡張。
- クリック頻度や信頼度を反映するため、クリックグラフからのエッジ重みを組み込んだ重み付きSimrankの導入。
- クエリ間の間接的な類似度パスの強度を定量化するためのエビデンスベースのSimrankの提案。
- 正規化と収束チェックを伴う、共有近傍を基にした反復的類似度計算。
- スケーラビリティを高めるために、関連するクエリ-広告相互作用に限定するサブグラフ抽出技術の採用。
- 類似度スコアを人為的評価と精度/再現率メトリクスと組み合わせ、リライトの順序付けと検証に活用。
実験結果
リサーチクエスチョン
- RQ1クエリと広告の内容が限定的である場合、SimRankはスポンサーリンク広告において有用なクエリリライトを効果的に特定できるか?
- RQ2クリックグラフにおけるエッジ重みが、クエリ類似度スコアの質と信頼性にどのように影響するか?
- RQ3エビデンスベースの類似度は、リライトのカバレッジと関連性をどの程度向上させるか?
- RQ4重み付きSimrankは、精度、再現率、リライトの深さにおいてベースライン手法と比べてどのように差をつけるか?
- RQ5強化されたSimRankのバリエーションは、既存の手法と比べて、リライト候補の望ましさをよりよく予測できるか?
主な発見
- 重み付きSimrankは5件のリライトで86%の精度を達成し、エビデンスベースのSimrank(80%)と単純なSimrank(75%)を大きく上回った。
- 99%のクエリカバレッジを維持し、96%のクエリが高品質なトップリライトを受けた。これは、エビデンスベースのSimrank(81%)と単純なSimrank(80%)を上回った。
- テストクエリの92%において、重み付きSimrankが最も望ましいリライトを正しく予測した。これは、エビデンスベースのSimrank(54%)と単純なSimrank(54%)を上回った。
- 85%以上のクエリが5件のリライトを受けた。エビデンスベースのSimrankは89%を達成し、重み付きSimrankはこの深さを維持した。
- エビデンススコアの追加によりリライトの質と深さが向上した。重み付きSimrankは、カバレッジや深さを損なわず、精度をさらに向上させた。
- Yahoo!エディトリアルチームによる人為的評価では、重み付きSimrankがピアソン相関や標準的なSimRankよりも関連性が高く有用なリライトを生成したことが確認された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。