QUICK REVIEW

[論文レビュー] Model-Independent Online Learning for Influence Maximization

Sharan Vaswani, Branislav Kveton|arXiv (Cornell University)|Mar 1, 2017

Advanced Bandit Algorithms Research被引用数 20

ひとこと要約

この論文は、特定の拡散モデルを仮定せずに、2点間到達確率を代理目的関数として用いるモデルに依存しないオンライン学習フレームワークを提案する。これにより、特定の拡散モデルを仮定しないまま、頑健で統計的に有効なシード選定が可能になる。本研究では、新しい2点間影響半バンドイットフィードバックモデルを備えたLinUCBベースのアルゴリズムを導入し、先行研究と比較してネットワークサイズに依存する要因が改善されたレグレットバウンドを達成する。

ABSTRACT

We consider influence maximization (IM) in social networks, which is the problem of maximizing the number of users that become aware of a product by selecting a set of "seed" users to expose the product to. While prior work assumes a known model of information diffusion, we propose a novel parametrization that not only makes our framework agnostic to the underlying diffusion model, but also statistically efficient to learn from data. We give a corresponding monotone, submodular surrogate function, and show that it is a good approximation to the original IM objective. We also consider the case of a new marketer looking to exploit an existing social network, while simultaneously learning the factors governing information propagation. For this, we propose a pairwise-influence semi-bandit feedback model and develop a LinUCB-based bandit algorithm. Our model-independent analysis shows that our regret bound has a better (as compared to previous work) dependence on the size of the network. Experimental evaluation suggests that our framework is robust to the underlying diffusion model and can efficiently learn a near-optimal solution.

研究の動機と目的

実際の状況ではしばしば未知または誤ったモデルとされる特定の拡散モデルに依存しない、ソーシャルネットワークにおけるインフルエンス最大化の課題に取り組むこと。
2点間の到達確率に基づく、統計的に有効でモデルに依存しないインフルエンス拡散のパrametrizationを構築すること。
インフルエンス要因をリアルタイムで学習しながら、探索と活用のバランスを取るオンライン学習アルゴリズムを設計すること。
先行研究と比較して、ネットワークサイズに依存する要因を低減することで、オンラインインフルエンス最大化におけるレグレットバウンドを改善すること。
グラフラプラシアン特徴量と共役勾配ソルバーを用いて、大規模ネットワーク向けに実用的でスケーラブルなアルゴリズムを提供すること。

提案手法

真のインフルエンス最大化目的関数を近似する、単調かつサブモジュラルな最大到達確率に基づく代理目的関数を提案する。
エッジレベルのフィードバックではなく、ノードペア間の影響結果を観測する2点間影響半バンドイットフィードバックモデルを導入する。
グラフラプラシアン固有ベクトルから導出された特徴量を用いて、インフルエンスプロセスを線形バンディット問題としてモデル化する。
到達確率の上側信頼区間を維持し、累積レグレットを最小化するようにシードセットを選択するLinUCBベースのアルゴリズムを開発する。
シルベスター方程式の定式化と共役勾配ソルバーを用いて、パラメータ推定値を効率的に更新するラプラシアン正則化を採用する。
逆行列の対角成分を効率的に維持するため、逆行列の更新にシェルマン＝モリソンの公式を用いる。

実験結果

リサーチクエスチョン

RQ1IC や LT といった特定の拡散モデルを仮定しないで、インフルエンス最大化を効果的に解くことができるか？
RQ2真のインフルエンス拡散に対して良い近似であり、かつ単調かつサブモジュラルであるような代理目的関数をどのように構築できるか？
RQ3レグレットを最小化しつつ、インフルエンスパラメータのオンライン学習を効率的に行うためにどのようなフィードバック構造が必要か？
RQ4既存手法と比較して、ネットワークサイズに依存する要因が有利にスケーリングされるようなレグレットバウンドを導出できるか？
RQ5グラフベースの特徴工学を用いて、実世界のネットワークに実用的かつスケーラブルなアルゴリズムを実現できるか？

主な発見

最大到達確率に基づく提案された代理目的関数は、真のインフルエンス最大化目的関数に対する強力な近似であり、効率的な最適化を可能にする。
LinUCBベースのアルゴリズムは、時間枠に最適な依存関係を達成し、先行研究と比較してネットワークサイズに伴うスケーリングが改善されたレグレットバウンドを達成する。
実世界のネットワークを用いた実験的評価により、フレームワークが下位の拡散モデルに対して頑健であることが示された。
ラプラシアン固有ベクトル特徴量の使用により、計算が効率的でスケーラブルな推論が可能となり、1ラウンドあたりO(dn²)時間でシステムを解く共役勾配が使用される。
事前に計算されたℓ₂ノルムとシェルマン＝モリソンの公式による動的更新を用いることで、到達確率の信頼区間が効率的に計算できる。
実験的結果から、アルゴリズムは迅速に収束し、真の拡散モデルが未知または誤った場合でも、ほぼ最適なインフルエンス拡散を達成することが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。