QUICK REVIEW

[论文解读] An optimal transport approach to data compression in distributionally robust control.

Filippo Fabiani, Paul J. Goulart|arXiv (Cornell University)|May 19, 2020

Markov Chains and Monte Carlo Methods被引用 2

一句话总结

本文提出一种基于最优传输的方法，对大规模输入-输出行为数据集进行压缩，以实现分布鲁棒控制，通过最小化Wasserstein距离来保持统计保真度。压缩后的数据集可使在线控制器在更大范围的模糊集下仍具备与完整数据集相同的鲁棒性能保证，该结论通过数值仿真得到验证。

ABSTRACT

We consider the problem of controlling a stochastic linear time-invariant system using a behavioural approach based on the direct optimization of controllers over input-output pairs drawn from a large dataset. In order to improve the computational efficiency of controllers implemented online, we propose a method for compressing this large data set to a smaller synthetic set of representative behaviours using techniques based on optimal transport. Specifically, we choose our synthetic data by minimizing the Wasserstein distance between atomic distributions supported on both the original data set and our synthetic one. We show that a distributionally robust optimal control computed using our synthetic dataset enjoys the same performance guarantees onto an arbitrarily larger ambiguity set relative to the original one. Finally, we illustrate the robustness and control performances over the original and compressed datasets through numerical simulations.

研究动机与目标

解决在随机线性时不变系统中，使用大规模数据集进行在线控制器实现时存在的计算效率低下问题。
开发一种数据压缩技术，以保持原始数据集的统计特性与鲁棒性。
确保在数据压缩后，分布鲁棒控制下的性能保证依然有效。
通过从原始数据集中导出的小型、代表性合成数据集，实现在线控制的高效实现。
证明压缩后的数据集可在任意更大的模糊集上支持与原始数据集相同的鲁棒性水平。

提出的方法

利用最优传输理论，通过最小化原始数据与合成数据经验分布之间的Wasserstein距离，构建合成数据集。
将原始数据集表示为原子分布，并构建一个支持集大小相同的较小合成原子分布。
将数据压缩问题建模为半离散最优传输问题，以寻找原始数据点到合成代表点的最优分配。
将所得合成数据集用于通过输入-输出对的直接优化，计算分布鲁棒控制器。
确保控制器对模糊集内分布偏移具有鲁棒性，且该模糊集可大于原始数据的支持范围。
利用Wasserstein度量的稳定性特性，保证压缩后鲁棒性与性能得以保持。

实验结果

研究问题

RQ1能否将大规模输入-输出行为数据集有效压缩为更小的合成数据集，而不会牺牲鲁棒控制性能？
RQ2通过最小化Wasserstein距离来使用最优传输，是否能保持分布鲁棒控制所需的统计保真度？
RQ3在压缩数据集上训练的控制器，是否可在大于原始数据支持范围的模糊集上维持相同的性能保证？
RQ4在保持鲁棒性的同时，数据压缩如何提升在线控制的计算效率？
RQ5合成数据集的大小与最终控制性能及鲁棒性之间存在何种关系？

主要发现

所提出的压缩方法保持了控制器的分布鲁棒性，确保性能保证在可大于原始数据支持范围的模糊集上依然成立。
原始数据与合成数据分布之间Wasserstein距离的最小化，确保了合成数据集在统计上能代表原始数据。
数值仿真结果表明，在压缩数据集上训练的控制器，其鲁棒性与控制性能与在完整数据集上训练的结果相当。
该方法在保持相同分布鲁棒性水平的同时，显著减小了数据集规模，提升了在线实现的计算效率。
理论分析证实，在合成数据上计算的分布鲁棒最优控制，继承了与原始数据相同的性能边界。
该方法具有可扩展性和通用性，只要最小化Wasserstein距离，其鲁棒性保证即与原始数据集规模无关。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。