QUICK REVIEW

[論文レビュー] Online Influence Maximization under Independent Cascade Model with Semi-Bandit Feedback

Zheng Wen, Branislav Kveton|arXiv (Cornell University)|May 21, 2016

Advanced Bandit Algorithms Research参考文献 24被引用数 51

ひとこと要約

本稿では、独立キャスケードモデルにおける半バンドイットフィードバックのもとで、オンラインインフルエンス最大化のための計算的に効率的なUCBベースのアルゴリズムであるIMLinUCBを提案する。この手法は、ネットワークのトポロジーとエッジ活性化確率に依存する多項式レグレットバウンドを達成し、大規模なネットワークへのスケーラビリティを実現する線形一般化を用いた、この設定における最初の理論的保証を提供する。

ABSTRACT

We study the online influence maximization problem in social networks under the independent cascade model. Specifically, we aim to learn the set of "best influencers" in a social network online while repeatedly interacting with it. We address the challenges of (i) combinatorial action space, since the number of feasible influencer sets grows exponentially with the maximum number of influencers, and (ii) limited feedback, since only the influenced portion of the network is observed. Under a stochastic semi-bandit feedback, we propose and analyze IMLinUCB, a computationally efficient UCB-based algorithm. Our bounds on the cumulative regret are polynomial in all quantities of interest, achieve near-optimal dependence on the number of interactions and reflect the topology of the network and the activation probabilities of its edges, thereby giving insights on the problem complexity. To the best of our knowledge, these are the first such results. Our experiments show that in several representative graph topologies, the regret of IMLinUCB scales as suggested by our upper bounds. IMLinUCB permits linear generalization and thus is both statistically and computationally suitable for large-scale problems. Our experiments also show that IMLinUCB with linear generalization can lead to low regret in real-world online influence maximization.

研究の動機と目的

初期に未知であった活性化確率を伴うソーシャルネットワークにおけるオンラインインフルエンス最大化を扱う。
指数的に多くの可能なインフルエンサー集合に起因する組み合わせ的行動空間を処理する。
影響を受けるエッジのみを観測する制限付きの半バンドイットフィードバックの下で動作する学習アルゴリズムを設計する。
大規模ネットワークにおける統計的効率性と計算スケーラビリティの両方を満たす手法を開発する。
ネットワークトポロジーとエッジ確率を反映する理論的レグレットバウンドを確立する。

提案手法

エッジ特徴量の線形一般化を用いて活性化確率をモデル化するUCBベースのアルゴリズムであるIMLinUCBを提案する。
共分散行列 $\mathbf{V}_t$ の逆行列を用いた自己正規化信頼区間により推定誤差を制御する。
線形モデル $\mathbf{w}(e) = \langle \mathbf{x}_e, \theta^* \rangle$ を用いてエッジ活性化確率を表現し、効率的な一般化を可能にする。
文献[1]における自己正規化マルティングルの不等式を用いて、推定誤差 $\| \overline{\theta}_t - \theta^* \|_{\mathbf{M}_t^{-1}}$ に対する高確率バウンドを適用する。
ネットワーク構造とエッジ確率に基づいて問題の複雑さを捉える最大観測関連性指標 $C_*$ を定義する。
エージェントが各拡散プロセス中にどのエッジが活性化されたかを観測する半バンドイットフィードバックモデルを採用する。

実験結果

リサーチクエスチョン

RQ1独立キャスケードモデルと半バンドイットフィードバックの下で、計算的に効率的なオンライン学習アルゴリズムを設計できるか？
RQ2オンラインインフルエンス最大化問題の情報理論的複雑度は何か？そして、ネットワークトポロジーとエッジ確率にどのように依存するか？
RQ3問題パラメータに多項式的に依存するレグレットバウンドを達成できるか？また、そのバウンドはネットワークの真の複雑さを反映するか？
RQ4線形一般化は、大規模なインフルエンス最大化における統計的および計算的効率性をどのように向上させるか？
RQ5提案されたアルゴリズムは、多様なネットワークトポロジーにおいて実際の場面でも低レグレットを達成するか？

主な発見

IMLinUCBは、インタラクション回数、ネットワークサイズ、特徴空間の次元数を含むすべての関連パラメータに対して多項式的累積レグレットバウンドを達成する。
レグレットバウンドは、インタラクション回数に近似的に最適な依存関係を示し、バンドイット設定における既知の下界と一致する対数因子を有する。
アルゴリズムのレグレットは、最大観測関連性指標 $C_*$ を通じてネットワークのトポロジーとエッジ活性化確率を反映しており、問題の複雑さを定量化する。
実験結果から、IMLinUCBのレグレットは、合成的および実世界のグラフトポロジーの多様な設定において理論的バウンドが示唆するスケーリングに従って増加することが示された。
線形一般化により、IMLinUCBは大規模な実世界のインフルエンス最大化タスクにおいても低レグレットを維持でき、実用的なスケーラビリティを示した。
パrameter推定誤差に対する高確率信頼区間は、自己正規化マルティングル不等式を用いて導出されており、逐次学習におけるロバストネスを保証する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。