Skip to main content
QUICK REVIEW

[論文レビュー] Streaming Stochastic Submodular Maximization with On-Demand User Requests

Honglian Wang, Sijing Tu|arXiv (Cornell University)|Jan 15, 2026
Optimization and Search Problems被引用数 0
ひとこと要約

この論文は、S3MOR(ストリーミングモデル)を導入し、オンデマンドのユーザ訪問を用いて期待トピックカバレッジを最大化することを目的とし、異なるメモリ前提の下で証明可能な競合比を持つメモリ効率の良いオンラインアルゴリズムを提案する。低メモリオプションと、未知の訪問回数を扱うマルチグレース Storm++ を提供する。

ABSTRACT

We explore a novel problem in streaming submodular maximization, inspired by the dynamics of news-recommendation platforms. We consider a setting where users can visit a news website at any time, and upon each visit, the website must display up to $k$ news items. User interactions are inherently stochastic: each news item presented to the user is consumed with a certain acceptance probability by the user, and each news item covers certain topics. Our goal is to design a streaming algorithm that maximizes the expected total topic coverage. To address this problem, we establish a connection to submodular maximization subject to a matroid constraint. We show that we can effectively adapt previous methods to address our problem when the number of user visits is known in advance or linear-size memory in the stream length is available. However, in more realistic scenarios where only an upper bound on the visits and sublinear memory is available, the algorithms fail to guarantee any bounded performance. To overcome these limitations, we introduce a new online streaming algorithm that achieves a competitive ratio of $1/(8δ)$, where $δ$ controls the approximation quality. Moreover, it requires only a single pass over the stream, and uses memory independent of the stream length. Empirically, our algorithms consistently outperform the baselines.

研究の動機と目的

  • ニュース推薦とオンデマンドのユーザ訪問に触発された S3MOR 問題を動機づけ formalize する。
  • パーティション・マトロイド制約の下で問題をサブモジュラー最大化としてモデル化する。
  • さまざまなメモリ制約の下で競争保証を持つメモリ効率の良いオンラインアルゴリズムを開発する。
  • 実証的評価を提供し、実用的な性能とスケーラビリティを示す。

提案手法

  • S3MOR をパーティション・マトロイド制約の下でサブモジュラー最大化へ還元し、オンラインストリーミングアルゴリズムを活用できるようにする。
  • LMGreedy を、ストリーム全体のメモリ利用が可能な場合の1/2競合比で提案する。
  • 訪問回数が未知だが上限 T' が利用可能な場合の競合比を 1/(4(T'−T+1)) とする Storm を開発する。
  • 未知の訪問回数を扱う Storm++ を複数の推測で実行・集約することで、1/(8δ) の競合比を達成し、メモリ/時間のトレードオフを δT' 倍に拡張する。
  • 応答時間、時間計算量、空間複雑度を分析し、Sieve++, Preemption、LMGreedy といったベースラインと比較する。
Figure 1 : Schematic view of our algorithm Storm . We first initialize $T^{\prime}$ empty active candidate sets. For each incoming news item in the stream $\mathbf{S}$ , we decide whether it can be added to/swapped into each of the active candidate sets. When a user submits a request, i.e., $\tau_{j
Figure 1 : Schematic view of our algorithm Storm . We first initialize $T^{\prime}$ empty active candidate sets. For each incoming news item in the stream $\mathbf{S}$ , we decide whether it can be added to/swapped into each of the active candidate sets. When a user submits a request, i.e., $\tau_{j

実験結果

リサーチクエスチョン

  • RQ1ストリーミング環境で複数のオンデマンド訪問に跨る期待トピックカバレッジをいかに最大化するか?
  • RQ2訪問が未知または上限のみの場合、メモリ制約下で境界付き競合保証を達成できるか?
  • RQ3オンライン S3MOR アルゴリズムにおけるメモリ使用、時間計算量、応答性のトレードオフは?
  • RQ4提案アルゴリズムを実データセット(Yahoo, RCV1, Amazon など)でベースラインと比較した際のカバレッジと効率性は?

主な発見

アルゴリズム競合比時間空間応答時間
LMGreedy1/2O(NT k)Θ(N+kT)O(Nk)
Storm1/(4(T'−T+1))O(NT'k)O(T'k)O(T')
Storm ++1/(8δ)O(NT'^{2}k/δ)O(T'^{2}k/δ)O(T')
  • LMGreedy はストリーム全体のメモリが利用可能な場合に達成可能な最良の1/2競合比を実現する。
  • 訪問回数が未知だが正確な回数が上限 T' の場合、Storm は 1/(4(T'−T+1)) の競合比を提供する。
  • Storm++ は T の複数の推測を実行して結果を統合することで 1/(8δ) の競合比を達成し、メモリ/時間は δT' 倍に増加する。
  • Storm および Storm++ は LMGreedy よりも応答時間が良く、単一訪問あたりのメモリも小さいが、いくつかの設定で競合比が劣る。
  • 提案アルゴリズムは複数データセット(Yahoo, RCV1, Amazon など)において、カバレッジとスケーラビリティの観点でベースライン(Sieve++, Preemption)を上回る実証結果を示す。
(a) Yahoo
(a) Yahoo

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。