QUICK REVIEW

[논문 리뷰] Intention-Net: Integrating Planning and Deep Learning for Goal-Directed Autonomous Navigation

Wei Gao, David Hsu|arXiv (Cornell University)|2017. 10. 16.

Robotic Path Planning Algorithms참고 문헌 21인용 수 72

한 줄 요약

두 수준의 아키텍처가 거친 맵 기반의 고수준 경로 계획자와 저수준 의도-네 모션 컨트롤러를 학습에 의해 결합하여 목표 지향 내비게이션과 강건한 로컬 인지를 달성한다.

ABSTRACT

How can a delivery robot navigate reliably to a destination in a new office building, with minimal prior information? To tackle this challenge, this paper introduces a two-level hierarchical approach, which integrates model-free deep learning and model-based path planning. At the low level, a neural-network motion controller, called the intention-net, is trained end-to-end to provide robust local navigation. The intention-net maps images from a single monocular camera and "intentions" directly to robot controls. At the high level, a path planner uses a crude map, e.g., a 2-D floor plan, to compute a path from the robot's current location to the goal. The planned path provides intentions to the intention-net. Preliminary experiments suggest that the learned motion controller is robust against perceptual uncertainty and by integrating with a path planner, it generalizes effectively to new environments and goals.

연구 동기 및 목표

새로운 실내 환경에서 최소한의 사전 정보로 강건한 목표 지향 자율 내비게이션을 촉진한다.
모델 기반 계획과 모델 자유 학습을 결합한 계층적 아키텍처를 제안한다.
계획 의도와 지각 입력에 조건화된 로컬 모션 컨트롤러(intention-net)를 학습한다.
시뮬레이션과 실제 로봇 실험을 통해 보지 않은 환경과 목표에 대한 일반화를 시연한다.

제안 방법

거친 2-D 바닥 계획을 사용하는 고수준 경로 계획자와 학습된 로우레벨 의도-네 모션 컨트롤러를 갖는 두 수준 계층을 도입한다.
의도 표현을 정의한다: Discretized Local Move (DLM)과 네 가지 값으로 표현되거나 Local Path and Environment (LPE)로서 224x224 이미지로 표현된다.
의도-네 F를 (카메라 이미지, 의도)에서 로봇 제어(속도 v, 조향)로 엔드투엔드로 매핑하도록 imitation learning으로 학습한다.
시뮬레이션에서 전문가로서 다이나믹 윈도우 방식으로 데이터를 수집하고, 실제 로봇에서 인간 조이스틱 제어로 학습 데이터를 수집한다.
계획된 경로를 처리해 매 시간 간격마다 의도를 생성하고 의도-네의 닫힌 루프 실행과 재계획을 가능하게 한다.
LPE의 경우 두 스트림 시아미 네트워크를 사용하거나 DLM의 경우 ResNet50 기반 융합을 사용해 지각 입력과 의도에서 제어를 추정한다.

실험 결과

연구 질문

RQ1거친 맵을 가진 고수준 계획자가 학습된 저수준 컨트롤러에 유용한 의도를 제공하여 목표 지향적 내비게이션을 달성할 수 있는가?
RQ2/ 의도에 조건화된 신경 모션 컨트롤러가 지각 불확실성과 위치 추정 오차에 대한 강건성을 향상시키는가?
RQ3/ 학습 중 보지 못한 새로운 환경과 목표에 대해 통합 시스템은 얼마나 잘 일반화되는가?
RQ4/ 의도 표현으로서 DLM과 LPE의 비교 이점은 무엇인가?

주요 결과

거친 맵을 가진 두 수준 접근 방식은 보지 못한 환경에서도 목표 지향 내비게이션의 강건성을 제공한다.
일반적으로 LPE-Net이 DLM-Net보다 우수한 성능을 보이며, 특히 급한 회전과 새로운 환경에서 차이가 크다.
두 의도-네 변형 모두 다수의 과제에서 베이스라인(Path Tracker, Dynamic Window)보다 성공률, 개입 횟수, 시간, 매끄러움 면에서 우수하다.
의도 입력이 없는 비-의도 네트워크는 대부분의 과제에서 실패하며, 전역 가이드에 대한 의도의 중요성을 보여준다.
실제 로봇 실험에서 접근법이 움직이는 사람들, 유리문, 새로운 바닥에서도 일반화가 강하게 나타난 것을 확인되며, LPE-Net의 일반화가 특히 강하다.
로컬라이제이션 오차로 인해 실패가 발생할 수 있으며, 재계획은 도움이 되지만 불확실성에 더 강한 계획자면 더 robustness를 높일 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.