QUICK REVIEW

[논문 리뷰] Deep Imitation Learning for Autonomous Driving in Generic Urban Scenarios with Enhanced Safety

Jianyu Chen, Bodi Yuan|arXiv (Cornell University)|2019. 03. 02.

Autonomous Vehicle Technology and Safety참고 문헌 27인용 수 32

한 줄 요약

이 논문은 새뼈시간 예측을 위해 조감도 입력을 사용한 도시 주행용 깊은 모방 학습 프레임워크를 제시하고, 시뮬레이션에서의 안전한 테스트 시간 운용을 보장하기 위해 안전 집합 이론에 기반한 안전 컨트롤러를 보강합니다.

ABSTRACT

The decision and planning system for autonomous driving in urban environments is hard to design. Most current methods manually design the driving policy, which can be expensive to develop and maintain at scale. Instead, with imitation learning we only need to collect data and the computer will learn and improve the driving policy automatically. However, existing imitation learning methods for autonomous driving are hardly performing well for complex urban scenarios. Moreover, the safety is not guaranteed when we use a deep neural network policy. In this paper, we proposed a framework to learn the driving policy in urban scenarios efficiently given offline connected driving data, with a safety controller incorporated to guarantee safety at test time. The experiments show that our method can achieve high performance in realistic simulations of urban driving scenarios.

연구 동기 및 목표

도 handcrafted 정책 없이 도시 자율 주행에서 의사결정 및 계획 학습을 자극한다.
샘플 효율성과 일반화를 개선하기 위해 조감도 관측 표현을 제안한다.
오프라인 전문가 데이터에서 계획된 궤적을 예측하는 깊은 정책을 학습한다.
미래의 장애물 움직임을 예측하지 않고도 테스트 시간 동안 안전을 보장하기 위해 안전 컨트롤러를 도입한다.

제안 방법

HD 맵, 경로 설정, 신호등, 과거 객체, 과거 자가 상태를 인코딩하는 조감도 입력을 사용한다.
직접 제어 명령이 아닌 horizon H 동안의 계획된 궤적을 출력한다.
조감도 입력을 궤적 포인트로 매핑하는 CNN(VGG 유사)을 학습하고 변위 기반 손실을 사용한다.
데이터 수집 시 노이즈를 주입하여 공변량 시프트를 줄이는 데이터 보강을 한다.
안전 집합 이론에 기반한 안전 컨트롤러를 통합하여 계획자 출력이 이차 계획법(QP)을 통해 안전 제어 집합으로 투사되도록 한다.

실험 결과

연구 질문

RQ1오프라인 도시 주행 데이터로부터의 모방 학습이 일반적인 도시 시나리오에 대해 고성능 정책을 낼 수 있는가?
RQ2조감도 표현이 샘플 복잡도를 줄이고 도시 구성에 걸쳐 일반화를 향상시키는가?
RQ3장애물 궤적 예측을 요구하지 않고도 안전 컨트롤러를 도입하면 테스트 시 안전성을 보장하는가?
RQ4데이터 보강이 닫힌 루프 성능 및 섭동 회복에 어떤 영향을 미치는가?

주요 결과

최종 모델은 데이터 보강과 안전 컨트롤러를 포함했을 때 교차로 및 원형 교차로 실험에서 거의 완벽에 가까운 성공을 달성한다(교차로: 100%; 원형 교차로: 96%).
오픈 루프 변위 오차가 보강 및 안전 구성 요소로 개선되며, 비보강 baseline과 비교하여 새로운 도시에서 예: 기본 모델에서 0.16 m 대 0.44 m.
안전 컨트롤러는 Town03 및 Town01에서 다른 학습 기반 방법에 비해 차선 이탈 및 충돌과 같은 위반을 감소시키며 더 안전한 동작을 보장한다.
데이터 보강은 이상 상태에서의 회복력을 크게 향상시키고 복잡한 도시 시나리오에서 정책의 강건성을 향상시킨다.
이 접근법은 닫힌 루프 CARLA 실험에서 모듈식 파이프라인 및 다른 학습 방법들에 대해 경쟁력 있거나 우수한 성능을 보인다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.