QUICK REVIEW

[論文レビュー] Robot Learning in Homes: Improving Generalization and Reducing Dataset Bias

Abhinav Gupta, Adithyavairavan Murali|arXiv (Cornell University)|Jul 18, 2018

Robot Manipulation and Learning被引用数 61

ひとこと要約

この論文は、低コストのロボットを用いて実環境6軒で28kの把持データセットを収集し、ラベルノイズをモデル化するノイズ耐性のある学習アーキテクチャを導入し、実験ではラボで訓練したベースラインやDexNetベースラインに対して大幅な一般化向上（43.7%の改善）を示し、さらにノイズモデリングによる約10%の効果を示す。

ABSTRACT

Data-driven approaches to solving robotic tasks have gained a lot of traction in recent years. However, most existing policies are trained on large-scale datasets collected in curated lab settings. If we aim to deploy these models in unstructured visual environments like people's homes, they will be unable to cope with the mismatch in data distribution. In such light, we present the first systematic effort in collecting a large dataset for robotic grasping in homes. First, to scale and parallelize data collection, we built a low cost mobile manipulator assembled for under 3K USD. Second, data collected using low cost robots suffer from noisy labels due to imperfect execution and calibration errors. To handle this, we develop a framework which factors out the noise as a latent variable. Our model is trained on 28K grasps collected in several houses under an array of different environmental conditions. We evaluate our models by physically executing grasps on a collection of novel objects in multiple unseen homes. The models trained with our home dataset showed a marked improvement of 43.7% over a baseline model trained with data collected in lab. Our architecture which explicitly models the latent noise in the dataset also performed 10% better than one that did not factor out the noise. We hope this effort inspires the robotics community to look outside the lab and embrace learning based approaches to handle inaccurate cheap robots.

研究の動機と目的

多様な家庭環境でロボット把持データを収集することがデータセットのバイアスを低減し、一般化能力を向上させることを示す。
低コストのロボットがラベルノイズを導入することを示し、このノイズを明示的にモデリングして学習を改善できることを示す。
未知の家庭や物体へ一般化するスケーラブルなデータ収集と学習フレームワークを提供する。

提案手法

$3k未満のモバイルマニピュレータを組み立て、6軒の家で28kの把握例を収集する。
ノイズ付きラベルを潜在変数としてモデル化し、マージナル化層を持つGPNとNMNを組み合わせたRobust-Graspアーキテクチャを訓練する。
パッチベースの把持定式化: 候補となる把持の周囲に9つの画像パッチをサンプルし、各パッチと角度の成功確率を予測する。
グローバルなシーン情報、ロボットID、把持ピクセル位置を用いてNMNでノイズをモデル化し、EMラベルを明示せずにNMNとGPNを共に訓練する。
2段階の訓練: まずノイズを含むパッチでGPNを訓練し、次にNMNとGPNをエンドツーエンド最適化で共同訓練する。
事前学習済みのResNet-18特徴を利用しAdamで訓練する; held-outデータと実機（Real-LCAとReal-Sawyer）で評価する。

実験結果

リサーチクエスチョン

RQ1自宅で収集した把持データセットは、ラボで収集したデータと比較して未知の家庭環境への一般化を改善するか？
RQ2潜在ノイズモデル化アプローチは、低コストロボットが収集したノイズ付きデータからの学習を改善できるか？
RQ3未知の物体/環境に対して、DexNetベースラインおよびPatch-Graspと比較してRobust-Graspはどのように性能を発揮するか？
RQ4ホームデータでの訓練が、ラボ設置および家庭での展開に与える影響は何か？

主な発見

Model	Train Dataset	Test Lab-Baxter	Test Lab-LCA	Test Home-LCA
Patch-Grasp [4]	Lab-Baxter [4]	76.9	55.1	54.3
Patch-Grasp	Lab-LCA	58.0	69.1	56.5
Patch-Grasp	Home-LCA	71.5	71.3	69.9
Robust-Grasp	Lab-LCA	55.0	71.2	56.1
Robust-Grasp (Ours)	Home-LCA (Ours)	75.2	71.1	73.0

Home-LCAで訓練したRobust-Graspは、Home-LCAでテストした場合、Patch-Grasp (69.9%) より高い保持精度 (73.0%) を達成し、ラボベースの訓練ベースラインを上回る。
Home-LCAで訓練すると Real-LCA ハードウェアで評価した場合、Lab-Baxter データで訓練したモデルより43.7%改善を得られる。
Home-LCAで訓練したRobust-Graspは Real-LCA のシーンで DexNet より約33%優れており、家庭環境の非理想的なセンサにも頑健であることを示す。
データの潜在ノイズを因数分解すると、ノイズをモデリングしないモデルと比較して約10%の性能向上をもたらす。Real-Sawyer テストでは (77.5% vs 56.25%)。
データセット: 六軒の家で約28,000の把持を収集; 未知の3軒の家でのテストは、実環境の家庭への一般化を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。