QUICK REVIEW

[論文レビュー] An optimal transport approach to data compression in distributionally robust control.

Filippo Fabiani, Paul J. Goulart|arXiv (Cornell University)|May 19, 2020

Markov Chains and Monte Carlo Methods被引用数 2

ひとこと要約

本稿では、分布的ロバスト制御のための大規模な入出力行動データセットを、統計的忠実性を保ちながら圧縮する最適輸送に基づく手法を提案する。 Wasserstein距離を最小化することで、元のデータセットとの分布的類似性を維持する。圧縮されたデータセットを用いることで、オンライン制御器は、元のデータセットと同等のロバスト性能保証を達成でき、より大きな不確実性集合に対しても有効であることが数値シミュレーションで確認された。

ABSTRACT

We consider the problem of controlling a stochastic linear time-invariant system using a behavioural approach based on the direct optimization of controllers over input-output pairs drawn from a large dataset. In order to improve the computational efficiency of controllers implemented online, we propose a method for compressing this large data set to a smaller synthetic set of representative behaviours using techniques based on optimal transport. Specifically, we choose our synthetic data by minimizing the Wasserstein distance between atomic distributions supported on both the original data set and our synthetic one. We show that a distributionally robust optimal control computed using our synthetic dataset enjoys the same performance guarantees onto an arbitrarily larger ambiguity set relative to the original one. Finally, we illustrate the robustness and control performances over the original and compressed datasets through numerical simulations.

研究の動機と目的

確率的線形時不変システムにおけるオンライン制御実装のための大規模データセットの計算非効率性を解消すること。
元のデータセットの統計的およびロバスト性の性質を維持するデータ圧縮技術を開発すること。
分布的ロバスト性に基づく制御性能保証が、データ圧縮後も有効であることを保証すること。
元のデータセットから導出された代表的で小型の合成データセットを用いて、効率的なオンライン制御を可能にすること。
圧縮されたデータセットが、元のデータよりもはるかに大きな不確実性集合に対しても、同じレベルのロバスト性を維持できることを示すこと。

提案手法

最適輸送理論を用いて、元のデータと合成データの経験的分布間のWasserstein距離を最小化することで、合成データセットを構築する。
元のデータセットを原子測度として表現し、同じサポートサイズを持つより小さな合成原子測度を構築する。
元のデータポイントを合成代表点に最適に割り当てる半離散的最適輸送問題としてデータ圧縮を定式化する。
入出力ペairに対する直接最適化により、合成データセットを用いて分布的ロバスト制御器を計算する。
制御器の性能が、元のデータのサポートをはるかに超える範囲の分布シフトに対してもロバストであることを保証する。
Wasserstein距離の安定性特性を活用し、圧縮後もロバスト性と性能が保たれることを保証する。

実験結果

リサーチクエスチョン

RQ1大規模な入出力行動データセットを、ロバスト制御性能を損なわずに、より小さな合成データセットに効果的に圧縮できるか？
RQ2Wasserstein距離を最小化する最適輸送の使用が、分布的ロバスト制御に必要な統計的忠実性を保持できるか？
RQ3圧縮されたデータセットで訓練された制御器は、元のデータよりも大きな不確実性集合に対しても、同じ性能保証を維持できるか？
RQ4データ圧縮によってオンライン制御の計算効率がどのように向上するか、ロバスト性を保持したままか？
RQ5合成データセットのサイズと得られる制御性能およびロバスト性の関係は何か？

主な発見

提案手法は、制御器の分布的ロバスト性を保持しており、元のデータのサポートをはるかに超える不確実性集合に対しても性能保証が成立することを保証する。
元のデータ分布と合成データ分布間のWasserstein距離最小化により、合成データセットが元のデータに対して統計的に代表的であることが保証される。
数値シミュレーションにより、圧縮データセットで訓練された制御器が、元のデータセットで訓練されたものと同等のロバスト性と制御性能を達成することが確認された。
本手法により、同じレベルの分布的ロバスト性を維持しながら、データセットサイズを顕著に削減でき、オンライン実装における計算効率が向上する。
理論的分析により、合成データ上で計算された分布的ロバスト最適制御が、元のデータと同一の性能バインドを継承することが確認された。
Wasserstein距離を最小化する限り、元のデータセットサイズに依存しないため、本手法はスケーラブルかつ一般化可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。