[论文解读] On distributed convex optimization under inequality and equality constraints via primal-dual subgradient methods
该论文提出两种分布式原始-对偶次梯度算法——DLPDS 和 DPPDS——用于在全局不等式和等式约束下求解多智能体凸优化问题,利用拉格朗日松弛法与罚函数法。在满足 Slater 条件的前提下,即使在网络拓扑随时间变化且仅通过局部通信、无集中协调的情况下,该算法仍能使各智能体渐近收敛至最优解与最优值。
We consider a general multi-agent convex optimization problem where the agents are to collectively minimize a global objective function subject to a global inequality constraint, a global equality constraint, and a global constraint set. The objective function is defined by a sum of local objective functions, while the global constraint set is produced by the intersection of local constraint sets. In particular, we study two cases: one where the equality constraint is absent, and the other where the local constraint sets are identical. We devise two distributed primal-dual subgradient algorithms which are based on the characterization of the primal-dual optimal solutions as the saddle points of the Lagrangian and penalty functions. These algorithms can be implemented over networks with changing topologies but satisfying a standard connectivity property, and allow the agents to asymptotically agree on optimal solutions and optimal values of the optimization problem under the Slater's condition.
研究动机与目标
- 解决具有全局不等式和等式约束的分布式多智能体凸优化问题,其中每个智能体拥有局部目标函数与约束条件。
- 通过仅依赖局部信息交换,使智能体协作最小化全局目标函数,同时满足共享约束。
- 设计对时变网络拓扑具有鲁棒性的算法,确保在标准连通性假设下实现收敛。
- 通过将全局约束(不等式与等式)纳入分布式次梯度方法,拓展已有研究工作。
- 利用原始-对偶次梯度动态系统,实现对最优原始解与最优值的渐近收敛。
提出的方法
- 针对无等式约束的情形,采用拉格朗日松弛法建模问题,将最优解表征为拉格朗日函数的鞍点。
- 提出 DLPDS 算法,结合平均一致性、次梯度步长以及对局部约束集或紧致对偶集的原始/对偶投影。
- 针对局部约束集相同的情形,提出基于罚函数与原始-对偶次梯度动态的 DPPDS 算法。
- 采用动态平均一致性算法估计局部变量的全局平均值,确保在时变图上实现智能体间的一致性。
- 应用投影算子以在局部约束和对偶变量上保持可行性,利用凸分析与非扩张性质。
- 采用递减步长(例如 α(k) = 1/(k+1)),以确保收敛性同时保持迭代序列有界。
实验结果
研究问题
- RQ1能否将分布式次梯度方法扩展至处理多智能体系统中的全局不等式与等式约束?
- RQ2当仅知晓本地目标函数与约束时,智能体如何实现对共同最优解的一致性?
- RQ3网络拓扑与问题结构需满足何种条件,才能保证分布式原始-对偶算法的渐近收敛?
- RQ4在收敛行为与实现复杂度方面,拉格朗日松弛法与罚函数法有何异同?
- RQ5在满足周期性强连通性的时变通信图下,是否能保证收敛?
主要发现
- 在满足 Slater 条件且网络具有周期性强连通性的前提下,DLPDS 算法可渐近收敛至最优解与最优值。
- 当局部约束集相同时,DPPDS 算法通过基于罚函数的原始-对偶公式化,同样实现相同的收敛特性。
- 数值结果表明,在具有等式约束与框约束的五智能体系统中,两种算法均收敛至最优解 [1 1 1 1 1]ᵀ。
- 仿真结果表明,两种分布式算法的收敛速度慢于集中式次梯度方法。
- 理论分析证实,智能体间估计值的差异随时间减小,从而确保对最优解的一致性。
- 只要网络满足周期性强连通性与平衡通信假设,算法在时变拓扑下仍保持稳定与收敛。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。