QUICK REVIEW

[論文レビュー] Cloth Manipulation Using Random Forest-Based Controller Parametrization.

Biao Jia, Zherong Pan|arXiv (Cornell University)|Feb 27, 2018

3D Shape Modeling and Analysis参考文献 37被引用数 4

ひとこと要約

本稿では、視覚的特徴を直接最適な制御入力にマッピングすることで、布地のような高自由度の変形可能な物体のロバストな操作を実現するランダムフォレストベースのコントローラーを提案する。訓練データの分類とコントローラー最適化を模倣学習を用いて統合することで、ノイズに強い性能を達成し、平らにする、折りたたむ、ねじるといったタスクにおいて、最小限のハイパーパrameterチューニングで線形ベースラインを上回る性能を発揮する。

ABSTRACT

We present a novel approach for robust manipulation of high-DOF deformable objects such as cloth. Our approach uses a random forest-based controller that maps the observed visual features of the cloth to an optimal control action of the manipulator. The topological structure of this random forest-based controller is determined automatically based on the training data consisting visual features and optimal control actions. This enables us to integrate the overall process of training data classification and controller optimization into an imitation learning (IL) approach. Our approach enables learning of robust control policy for cloth manipulation with guarantees on convergence.We have evaluated our approach on different multi-task cloth manipulation benchmarks such as flattening, folding and twisting. In practice, our approach works well with different deformable features learned based on the specific task or deep learning. Moreover, our controller outperforms a simple or piecewise linear controller in terms of robustness to noise. In addition, our approach is easy to implement and does not require much parameter tuning.

研究の動機と目的

現実世界のセンシングとアクチュエータの不確実性下でも、高自由度の変形可能物体、特に布地のためのロバストな制御ポリシーを開発すること。
収束性と一般化性を保証する形で、視覚的認識と制御ポリシー学習を統合する課題に取り組むこと。
手動によるコントローラー設計や膨大なハイパーパrameterチューニングに依存することを減らし、データからコントローラー構造の学習を自動化すること。

提案手法

コントローラーは、布地の視覚的特徴を直接最適なマニピュレータ制御入力にマッピングするランダムフォレストを用いる。
ランダムフォレストのトポロジカル構造は、視覚的特徴とそれに対応する最適制御入力が含まれた訓練データから自動的に学習される。
訓練データの分類とコントローラー最適化を統合的な模倣学習フレームワークに統合する。
視覚的特徴は、タスク固有の変形特性に基づいて抽出されるか、タスク適応のためのディープラーニングにより学習される。
動的モデルの明示的記述を避けて、デモンストレーションからエンドツーエンドで学習することで、ノイズに強い性能を実現する。

実験結果

リサーチクエスチョン

RQ1ランダムフォレストベースのコントローラーは、明示的な動的モデルなしに、布地操作のためのロバストで一般化可能なポリシーを学習できるか？
RQ2模倣学習を用いた訓練データ分類とコントローラー最適化の統合は、性能向上と収束性改善にどのように寄与するか？
RQ3ノイズが多い、または複雑な操作シナリオにおいて、提案手法は単純または区分線形コントローラーをどの程度上回るか？
RQ4最小限の再チューニングで、複数の布地操作タスクに容易に展開可能か？

主な発見

提案されたコントローラーは、平らにする、折りたたむ、ねじるといった複数の布地操作タスクでロバストな性能を達成した。
センサーやアクチュエータのノイズに対して、単純および区分線形コントローラーを上回るロバスト性を示した。
パrameterチューニングが最小限で、実装が容易なため、実用的で即時の導入が可能である。
模倣学習フレームワークにより、ポリシー学習中に収束保証が得られ、信頼性が向上した。
タスク固有の、またはディープラーニングで学習された変形特徴を入力として用いることで、タスク間での一般化性が高く、優れた性能を発揮した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。