QUICK REVIEW
[論文レビュー] Concept-based Recommendations for Internet Advertisement
Dmitry I. Ignatov, Sergei O. Kuznetsov|arXiv (Cornell University)|Jun 26, 2009
Recommender Systems and Techniques参考文献 5被引用数 29
ひとこと要約
本稿では、形式概念分析(FCA)および関連ルールマイニングを用いて、広告主に解釈可能でデータ駆動型の推薦を提供する概念ベースのレコメンデーションシステムを提案する。競合広告主の入札行動を形式的概念および形態的/オントロジー基盤のメタルールを用いて分析することで、新しい広告用語に対して高い信頼性(平均信頼度 >0.9)の推薦を生成する。これは、標準的なデータマイニング手法に比べて、推薦の解釈可能性と正確性を著しく向上させる。
ABSTRACT
The problem of detecting terms that can be interesting to the advertiser is considered. If a company has already bought some advertising terms which describe certain services, it is reasonable to find out the terms bought by competing companies. A part of them can be recommended as future advertising terms to the company. The goal of this work is to propose better interpretable recommendations based on FCA and association rules.
研究の動機と目的
- 標準的なデータマイニング手法を超えて、インターネット広告用語の推薦の解釈可能性と正確性を向上させること。
- 広告主と入札関係の形式的概念分析(FCA)を用いて、市場セクターと関連する広告用語を特定すること。
- 経験的購買データに依存せず、形態的およびオントロジー基盤のメタルールを用いて安定的で解釈可能な推薦ルールを生成すること。
- FCAに基づく推薦の有効性を、交差検証およびGoogle AdWordsの同義語リストとの比較によって検証すること。
提案手法
- 米国Overture広告データを形式的文脈(G, M, I)に変換し、G = 広告主、M = 入札用語、I = 購入関係とする。
- D-minerアルゴリズムを適用して、拡張および意図のサイズに制約を設けた形式的概念(市場セクター)を抽出し、顕著な市場セグメントを同定する。
- コロナシステムを用いて文脈からの関連ルールをマイニングし、最小サポート(min supp = 1%)および最小信頼度(min conf = 90%)の閾値を設定する。
- 言語的パターンを用いて、データに依存せずに妥当な用語推薦を導出可能な形態的メタルール(例:t_F_T → S_i t_i)を開発する。
- 主題カタログを用いてオントロジー基盤のメタルールを構築し、Google AdWordsの同義語出力と照合して妥当性を検証する。
- 10分割交差検証を用いてルールを検証し、テストセットの信頼度を測定することで一般化および安定性を評価する。
実験結果
リサーチクエスチョン
- RQ1広告主と入札関係から導出された形式的概念は、解釈可能な市場セクターを効果的に特定できるか?
- RQ2形態的分析は、データに依存せず、高信頼性のメタルールを生成して新しい広告用語を推薦できるか?
- RQ3オントロジー基盤のメタルールは、実世界の同義語システム(例:Google AdWords)とどの程度一致するか?
- RQ4交差検証で未観測のテストデータに対して、FCAに基づく関連ルールの平均信頼度とサポートはどの程度か?
主な発見
- テストセットにおける関連ルールの平均信頼度は0.87であり、最小信頼度閾値0.9に非常に近い結果となり、良好な一般化性能を示している。
- 最小信頼度 ≥0.5 のルールについて、10回の交差検証の平均信頼度は0.92であった。これは、高い信頼性を示している。
- 最も信頼度が高く、サポートも高いメタルールは t_F_T → S_i t_i の形式をとり、平均信頼度0.69、サポート20(最小サポートを0.5に設定時)であった。
- オントロジー基盤のメタルールが生成した推薦の90%が、Google AdWordsの同義語リストに含まれており、実世界の関連性が裏付けられた。
- 形態的メタルールは、t_F_T → t_i such that t_IT_S_i ⊆ t_IT_S 群について、平均信頼度0.70、サポート21を達成し、強い予測能力を示した。
- 本手法は、20社以上の企業が参加する大規模な市場セクターを効果的に同定できており、スケーラビリティおよび市場セグメンテーションの能力を示した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。