QUICK REVIEW

[论文解读] The Stability of Online Algorithms in Performative Prediction

Gabriele Farina, Juan C. Perdomo|arXiv (Cornell University)|Feb 27, 2026

Advanced Bandit Algorithms Research被引用 0

一句话总结

该论文证明，在执行性设置中部署的任意无后悔online算法会收敛到一个执行性稳定的模型混合体，且不假设分布映射的 Lipschitz 连续性，同时将稳定性保证扩展到弱凸或非光滑损失。

ABSTRACT

The use of algorithmic predictions in decision-making leads to a feedback loop where the models we deploy actively influence the data distributions we see, and later use to retrain on. This dynamic was formalized by Perdomo et al. 2020 in their work on performative prediction. Our main result is an unconditional reduction showing that any no-regret algorithm deployed in performative settings converges to a (mixed) performatively stable equilibrium: a solution in which models actively shape data distributions in ways that their own predictions look optimal in hindsight. Prior to our work, all positive results in this area made strong restrictions on how models influenced distributions. By using a martingale argument and allowing randomization, we avoid any such assumption and sidestep recent hardness results for finding stable models. Lastly, on a more conceptual note, our connection sheds light on why common algorithms, like gradient descent, are naturally stabilizing and prevent runaway feedback loops. We hope our work enables future technical transfer of ideas between online optimization and performativity.

研究动机与目标

在预测性决策中将执行性Motivate与形式化，当部署的模型影响未来数据时。
证明任意无后悔在线算法都会产生一个执行性稳定的模型混合体。
提供不依赖数据生成映射的 Lipschitz 或光滑性假设的稳定性保证。
证明像梯度下降这样的常见算法在其迭代被混合时可达到稳定性。
将稳定性结果扩展到弱凸或非光滑损失函数和有限样本再训练情形。

提出的方法

将数据生成过程建模为 z_t ~ D(θ_t)，其中 θ_t 是当前模型。
考虑由无后悔在线算法产生的一系列模型，并对 {θ_1,...,θ_T} 形成统一混合 μ。
通过基于鞅的在线到批次的论证证明统一混合 μ 是 Regret(T)/T-执行性稳定的。
显示与以往工作不同，该归约不依赖 D(·) 的连续性或损失的强凸性。
在广义条件下推导再训练的有限样本Guarantees 及 SGD/梯度下降的推论。
讨论在弱凸或非光滑损失下的稳定性含义。

实验结果

研究问题

RQ1任何与 D(·) 诱导分布耦合的无后悔在线算法是否会收敛到一个执行性稳定的混合？
RQ2在没有分布映射 D(·) 的 Lipschitz/连续性假设下是否也能获得稳定性保证？
RQ3常见优化过程（如梯度下降、再训练）是否通过基于混合的归约而自然继承执行性稳定性？
RQ4在非光滑或弱凸损失的执行性设置下，对再训练可以推导出哪些有限样本保证？
RQ5这些结果如何与在更严格光滑性假设下的先前执行性预测工作相关并扩展其范围？

主要发现

对任意无后悔在线算法的迭代所形成的统一混合，在 Regret(T)/T-执行性稳定。
对任意分布映射 D(·) 的稳定性成立，无需连续性或 Lipschitz 假设。
推论表明梯度下降与再训练在更弱的损失/DT 条件下也能收敛到稳定性，包括非光滑/弱凸损失。
针对平滑化再训练给出有限样本结果，在广义假设下与先前速率相匹配或更优。
该框架解释了为何经典算法在动态的执行性环境中自然抵抗失控的反馈回路。
结果提供了一个统一的在线学习视角用于执行性预测，将稳定性保证扩展到新情形。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。