Skip to main content
QUICK REVIEW

[論文レビュー] Query Representation with Global Consistency on User Click Graphs

Daqiang Zhang, Rongbo Zhu|arXiv (Cornell University)|Sep 1, 2013
Advanced Graph Neural Networks被引用数 2
ひとこと要約

本稿では、クリックグラフにおけるURLのローカル(クリック頻度)およびグローバル(逆クエリ頻度)な性質を統合する、クエリ表現のためのグローバル一貫性モデルを提案する。逆URL頻度を新たなグローバル指標として導入することで、表現学習が向上し、AOL検索ログデータセットにおいて従来手法を上回る優れた性能を達成した。

ABSTRACT

The Internet of Things aggregates large-scale query logs. A query log is generally represented as a bipartite graph on a query set and a URL set. Most of the traditional methods used the raw click frequency to weigh the link between a query and a URL on the click graph. In order to address the disadvantages of raw click frequency, researchers proposed the entropy-biased model, which incorporates raw click frequency with inverse query frequency of the URL as the weighting scheme for query representation. In this paper, we observe that the inverse query frequency can be considered a global property of the URL on the click graph, which is more informative than raw click frequency, which can be considered a local property of the URL. Based on this insight, we develop the global consistency model for query representation, which utilizes the click frequency and the inverse query frequency of a URL in a consistent manner. Furthermore, we propose a new scheme called inverse URL frequency as an effective way to capture the global property of a URL. Experiments have been conducted on the AOL search engine log data. The result shows that our global consistency model achieved better performance than the current models.

研究の動機と目的

  • ローカルクリック頻度の限界を解消するため、URLのグローバルな性質を統合すること。
  • 逆クエリ頻度をより情報豊かな指標として用いて、クリックグラフにおけるURLのグローバル一貫性をモデル化すること。
  • URLのクリックグラフ全体における特性をよりよく捉えるために、新たなグローバル指標「逆URL頻度」を提案すること。
  • 一貫したフレームワーク内でURLのローカルおよびグローバルな性質を統合することで、クエリ表現学習を向上させること。
  • 提案手法の有効性を実世界の検索ログデータ上で評価すること。

提案手法

  • グローバル一貫性モデルは、クリックグラフにおけるURLの生のクリック頻度(ローカル性質)と逆クエリ頻度(グローバル性質)を統合的な表現フレームワークで統合する。
  • モデルは、クリックグラフ全体でURLに関連付けられたクエリ総数の逆数として計算される、逆URL頻度を新たなグローバル指標として導入する。
  • 重み付け方式は、関連性と分布的情報の両方をバランスさせる一貫した定式化を用いて、ローカルおよびグローバルな性質を統合する。
  • モデルは、クエリ-URLクリックグラフの二部グラフ構造を活用して、グローバル一貫性信号を伝搬および集約する。
  • モデルはAOL検索エンジンログデータセット上で訓練および評価され、標準的なリtrievalおよびランク付け指標が用いられる。
  • ベースラインモデル(エントロピー歪みモデルなど)と比較することで、本手法のクエリ表現における優位性を検証する。

実験結果

リサーチクエスチョン

  • RQ1クリックグラフにおけるURLのグローバル性質は、ローカルクリック頻度を超えてどのようにクエリ表現を改善できるか?
  • RQ2逆クエリ頻度をグローバル指標として統合することで、クエリ表現にどのような影響を与えるか?
  • RQ3ローカルおよびグローバルな性質を統合する統一フレームワークは、既存のモデルを上回る性能を発揮できるか?
  • RQ4提案された逆URL頻度指標は、クリックグラフにおける意味のあるグローバルパターンをどれほど的確に捉えられるか?
  • RQ5グローバル一貫性モデルは、実世界の検索ログにおけるリtrievalパフォーマンスに顕著な改善をもたらすか?

主な発見

  • グローバル一貫性モデルは、エントロピー歪みアプローチを含む既存のモデルを上回る性能を示した。
  • 逆URL頻度をグローバル指標として導入することで、モデルが意味のあるURL特性を捉える能力が著しく向上した。
  • 一貫したフレームワーク内でローカルおよびグローバルな性質を統合することで、より強固で情報豊かなクエリ表現が得られた。
  • モデルはAOL検索エンジンログデータセットで優れたパフォーマンスを達成し、実世界の環境における有効性を示した。
  • 結果から、生のクリック頻度だけではなく、逆クエリ頻度のようなグローバル性質が、より情報豊かな信号を提供することが確認された。
  • 提案手法は、標準評価指標のすべてで一貫した改善を示し、設計の妥当性が裏付けられた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。