Skip to main content
QUICK REVIEW

[논문 리뷰] IntentNet: Learning to Predict Intention from Raw Sensor Data

Sergio Casas, Wenjie Luo|arXiv (Cornell University)|2021. 01. 20.
Autonomous Vehicle Technology and Safety인용 수 250
한 줄 요약

IntentNet은 원시 LiDAR BEV 데이터와 동적 맵에서 직접 차량을 탐지하고 연속적인 궤적과 이산적 고수준 의도를 함께 예측하는 단일 엔드-투-엔드 네트워크로, 공유 계산으로 탐지, 궤적 예측 및 의도 예측을 향상시킵니다.

ABSTRACT

In order to plan a safe maneuver, self-driving vehicles need to understand the intent of other traffic participants. We define intent as a combination of discrete high-level behaviors as well as continuous trajectories describing future motion. In this paper, we develop a one-stage detector and forecaster that exploits both 3D point clouds produced by a LiDAR sensor as well as dynamic maps of the environment. Our multi-task model achieves better accuracy than the respective separate modules while saving computation, which is critical to reducing reaction time in self-driving applications.

연구 동기 및 목표

  • 다른 에이전트의 고수준 의도와 미래 모션을 정확하게 추론하여 안전한 자율 주행을 촉진한다.
  • LiDAR BEV와 동적 맵 정보를 융합하여 이산적 행동과 연속적 궤적을 예측하는 원스테이지 네트워크를 개발한다.
  • 탐지, 의도 분류 및 궤적 회귀를 함께 최적화하여 정확도를 높이되 계산 시간을 줄인다.

제안 방법

  • LiDAR 포인트 구름을 높이를 채널로 하는 3D 텐서로 BEV에 표현하고 과거 스윕들을 축적하여 시계열 맥락을 반영한다.
  • 동적 HD 맵을 BEV 이진 마스크로 래스터화하여 도로 토폴로지, 차선, 교차로 및 신호등 상태를 인코딩한다.
  • LiDAR BEV와 맵 입력을 각각 처리하는 2스트림 백본을 사용하고 기능을 융합한 뒤 탐지, 이산적 의도, 궤적 회귀의 세 가지 태스크 헤드로 전달한다.
  • 각 앵커 박스마다 (i) 차량/배경 탐지 점수, (ii) 8개 클래스의 이산적 고수준 의도, (iii) 시간 스텝에 걸친 바운딩 박스 형태의 미래 궤적을 예측한다.
  • 탐지 손실, 시간 할인된 의도 교차 엔트로피, 그리고 궤적에 대한 가중화된 매끄러운 L1 회귀 손실을 포함하는 다태스크 손실로 엔드투엔드 학습을 수행하고, 미래 불확실성을 반영하기 위한 시간 할인 인자를 포함한다.

실험 결과

연구 질문

  • RQ1단일 엔드투엔드 네트워크가 원시 LiDAR 및 맵 데이터로 차량을 공동 탐지하고 이산적 고수준 의도를 예측하며 장기 궤적을 예측할 수 있는가?
  • RQ2LiDAR와 맵 정보의 조기/늦은 융합 및 시계열 맥락이 FaF 기반 접근법에 비해 탐지 및 의도/궤적 예측을 향상시키는가?
  • RQ3맵 프라이어와 이산적 의도 손실의 포함이 전체 탐지 및 모션 예측 성능에 어떤 영향을 미치는가?

주요 결과

모델mAP@0.5mAP@0.6mAP@0.7mAP@0.8mAP@0.9
SqueezeNet74.062.341.913.80.2
SSD84.075.158.226.01.0
MobileNet86.178.360.427.51.1
FaF89.882.568.135.82.5
FaF’88.480.164.130.91.6
IntentNet94.489.475.443.53.9
IntentNet*88.?80.164.130.91.6
  • IntentNet은 실시간 탐지기보다 IoU 수준에서 더 높은 mAP를 달성한다(예: mAP@0.5 = 94.4, mAP@0.6 = 89.4, mAP@0.7 = 75.4, mAP@0.8 = 43.5, mAP@0.9 = 3.9).
  • 궤적 회귀는 FaF 및 FaF’ 대비 L1 추적 내 위치(L1 along-track), 횡단(L1 across-track) 및 헤딩 오차에서 개선된다(예: along 0s: 0.26 m; 1s: 0.46 m; across 0s: 0.15 m; heading 0s: 5.14 deg).
  • IntentNet은 의도 예측에서 baselines를 능가하며, 특히 덜 대표적인 행동에 대해 맵과 이산적 의도 모델링을 통해 모든 행동의 평균 정확도가 97.7%에 도달한다.
  • 맵 프라이어와 이산적 의도 손실의 포함이 전체 성능을 최적으로 만들고, 맵 제거나 의도 손실 제거는 결과를 저하시키는 것으로 나타났으며 이는 제거 연구에서 확인된다.
  • FaF에 비해 전체 입력(맵 + 고수준 행동)을 갖춘 IntentNet이 탐지 및 더 긴 시퀀스의 모션 예측에서 성능이 향상된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.