[論文レビュー] WestWorld: A Knowledge-Encoded Scalable Trajectory World Model for Diverse Robotic Systems
WestWorldは形態情報に基づく構造を埋め込んだシステム意識型Mixture-of-Experts(MoE)軌道世界モデルを提案し、様々なロボット間でダイナミクス学習をスケールさせ、ゼロショットおよび少数ショットの一般化と下流の制御性能を向上させる。89環境で事前学習を行い、現実世界でのGo1展開を実証する。
Trajectory world models play a crucial role in robotic dynamics learning, planning, and control. While recent works have explored trajectory world models for diverse robotic systems, they struggle to scale to a large number of distinct system dynamics and overlook domain knowledge of physical structures. To address these limitations, we introduce WestWorld, a knoWledge-Encoded Scalable Trajectory World model for diverse robotic systems. To tackle the scalability challenge, we propose a novel system-aware Mixture-of-Experts (Sys-MoE) that dynamically combines and routes specialized experts for different robotic systems via a learnable system embedding. To further enhance zero-shot generalization, we incorporate domain knowledge of robot physical structures by introducing a structural embedding that aligns trajectory representations with morphological information. After pretraining on 89 complex environments spanning diverse morphologies across both simulation and real-world settings, WestWorld achieves significant improvements over competitive baselines in zero- and few-shot trajectory prediction. Additionally, it shows strong scalability across a wide range of robotic environments and significantly improves performance on downstream model-based control for different robots. Finally, we deploy our model on a real-world Unitree Go1, where it demonstrates stable locomotion performance (see our demo on the website: https://westworldrobot.github.io/). The code will be available upon publication.
研究の動機と目的
- 異種ロボット形態とセンサ/アクチュエータ動力学に対するスケーラブルな軌道世界モデルの必要性を動機づける。
- ロボットごとにダイナミクスを特化させつつグローバルモデルを共有するシステム意識型Mixture-of-Expertsアーキテクチャを提案する。
- 軌道表現をロボット形態と整列させる構造ベースの埋め込みを組み込み、一般化を高める。
- 大規模で多様なデータセットで事前学習を行い、ゼロショット・少数ショット・スケーラビリティ・下流のモデルベース制御性能を評価する。
- Unitree Go1での現実世界デプロイを示し、実用性を検証する。
提案手法
- 軌道チャネルを離散トークンへトークン化・正規化する。
- articulated-bodyの運動学木に基づく知識エンコード構造埋め込みを介して形態情報を注入する。
- learnableなシステム埋め込みを伴うシステム意識型MoE(Sys-MoE)を用いて、複数の専門ダイナミクスエキスパート間のルーティングを行う。
- Sys-MoEブロックの前に注意機構ベースの状態集約と行動条件付きクロスアテンションを用いる。
- 複数のSys-MoEブロックをシステム条件付きルーティング機構で積み重ね、1つの前方伝播で多ステップ軌道を予測する。
- 離散化された軌道状態に対する次トークン交差エントロピーで訓練する。
実験結果
リサーチクエスチョン
- RQ1システム意識型MoEモデルは勾配干渉なしに多様なロボット形態間でダイナミクス学習をスケールできるか。
- RQ2形態情報を含む構造埋込みを導入すると、未知ロボットのゼロショット・少数ショットの軌道予測は改善されるか。
- RQ3下流のモデルベース制御において、西部世界はベースラインと比較してどの程度性能を発揮するか。
- RQ4前処理環境数が増加してもアプローチはスケーラブルか。
- RQ5現実世界のロボットプラットフォームへモデルを効果的に移行できるか。
主な発見
| Method | Walker2D MAE | Walker2D MSE | Hopper MAE | Hopper MSE | Franka MAE | Franka MSE |
|---|---|---|---|---|---|---|
| MLPEnsemble | 26.006 | 12.028 | 19.987 | 7.216 | 12.164 | 4.271 |
| TDM | 20.122 | 6.428 | 17.634 | 5.076 | 23.686 | 8.435 |
| TrajWorld | 22.261 | 8.623 | 17.388 | 5.441 | 13.102 | 5.127 |
| WestWorld (Ours) | 16.350 | 5.064 | 13.731 | 3.368 | 7.737 | 2.539 |
- WestWorldは未知のWalker2D、Hopper、現実世界のFrankaに対するゼロショット長距離予測でベースラインを上回る。
- 現実ロボットでの少数ショット適応は事前学習とともに強い性能向上を示す。
- Sys-MoEルータはほぼスパースで、形態ごとに専門化されたダイナミクスの使用を示している。
- 事前学習はWalker2D、Hopper、Unitree Go1における下流MPPI制御の初期化を強化する。
- 本モデルは89環境(シミュレーションと現実世界)へスケールし、環境数が増加しても精度を維持し、TrajWorldをスケーラビリティで上回る。
- 現実世界のUnitree Go1での蒸留とシミュレーションデータを用いた展開により、MPPI制御で安定した歩行を達成する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。