Skip to main content
QUICK REVIEW

[論文レビュー] Cutting the Cord: System Architecture for Low-Cost, GPU-Accelerated Bimanual Mobile Manipulation

Artemis Shaw, Chen Liu|arXiv (Cornell University)|Mar 10, 2026
Modular Robots and Swarm Intelligence被引用数 0
ひとこと要約

論文は、XLeRobot ベースのオンボード Jetson Orin Nano を備えた、GPU 支援・ untethered の低コスト約1300ドルの両手式モバイルマニピュレータを提案し、最適化された機械設計、Tri-Bus 電力アイソレーション、そして Teleoperation、SLAM ナビゲーション、ビジョンベースの操作のための組み込み ROS2 自律スタックを特徴とする。

ABSTRACT

We present a bimanual mobile manipulator built on the open-source XLeRobot with integrated onboard compute for less than \$1300. Key contributions include: (1) optimized mechanical design maximizing stiffness-to-weight ratio, (2) a Tri-Bus power topology isolating compute from motor-induced voltage transients, and (3) embedded autonomy using NVIDIA Jetson Orin Nano for untethered operation. The platform enables teleoperation, autonomous SLAM navigation, and vision-based manipulation without external dependencies, providing a low-cost alternative for research and education in robotics and robot learning.

研究の動機と目的

  • オープンソースハードウェア(XLeRobot/XLeRobot 系統)上に構築された、オンボード GPU コンピュートを備えた低コスト・ untethered な両手式モバイルマニピュレータを実証する。
  • 機械的剛性、電力安定性、組み込み計算の実践的統合課題に対処し、信頼性の高い自律および遠隔操作機能を実現する。
  • 教育とロボット学習の研究を促進する開放的で再現可能な設計パッケージ(CAD、配線図、データ)を提供する。

提案手法

  • 剛性対重量比を最大化する勾配状の3Dプリント手法を用いた構造トポロジの最適化。
  • 高トルクモータ負荷を組み込み計算から電気的に分離し、ファームウェアレベルの電流エンベロープを実装する Tri-Bus 電力トポロジ。
  • Jetson Orin Nano 上で edge ベンチマークを行い、認識、逆運動学(IK)、SLAM、ナビゲーション、遠隔操作を統合する ROS2 ベースの組み込み自律スタック。
  • 認識主導の操作パイプラインを RGB-D データから IK 主導のモータ命令へ変換する、認識・座標変換・IK・モータマッピングのモジュール化・検証可能なシーケンス。
  • RTAB-Map と ROS 2 Nav2 を用いた SLAM ナビゲーション、地図ベースの局所化、基底機へのブリッジベース命令変換。
  • データ収集と人間の介在操作のための VR 遠隔操作アーキテクチャ、素手追跡とVR コントローラをプラットフォーム跨いでサポート。

実験結果

リサーチクエスチョン

  • RQ1低コスト・ untethered な両手式モバイルマニピュレータが、オンボード GPU コンピュートで信頼できる操作と自律を実現できるか。
  • RQ2機械的トポロジーと電力分配の選択が、 untethered 動作時の安定性・性能・信頼性にどのように影響するか。
  • RQ3埋め込みGPU での認識→行動パイプラインのエンドツーエンド性能はリアルタイム操作タスクでどれくらいか。
  • RQ4VR ベースの遠隔操作は、巧妙な両手作業と模倣学習のデータ収集にどれほど有効か。
  • RQ5異なる3Dプリントトポロジーの剛性・ペイロード・質量のトレードオフはどうなるか。

主な発見

ModelHKTt_e2e (ms)f_replan_max (Hz)
ACT10050-36.0 ± 0.927.8
Diffusion201010539.6 ± 0.11.8
SmolVLA201010713.8 ± 9.31.4
  • High-Shell 構造トポロジは、Baseline および High-Infill デザインと比較して剛性が高く、質量を抑えつつ約1 kg のペイロード能力を実現。
  • Tri-Bus 電力トポロジとファームウェアベースの電流エンベロープは、大トルク多軸操作時のブランウトを防ぎ、安定した 12V レールを維持して untethered 動作を可能にする。
  • Jetson Orin Nano を搭載したオンボードの TPU/GPU コンピュートは、認識・IK・SLAM・ニューラルネット推論を 15–25W 内でサポートし、負荷下で最大約30分の untethered 動作を維持。
  • 5对象での把持成功率は 98.7% で、Fin Ray 適合グリッパーによる信頼性の高い両手操作を示す。
  • エッジ計算ベンチマークは ACT、Diffusion Policy、SmolVLA が再計画頻度を変動させることを示し、ACT は最大約 27.8 Hz、Diffusion ベースのポリシーは設定により約 1.8–1.4 Hz に達する。
  • VR 遠隔操作のモダリティは、ペグインホール課題のタスク時間を顕著に短縮し、VR コントローラは平均 48.22s、手追跡は 68.30s、Baseline Xbox コントローラは 248.73s。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。