Skip to main content
QUICK REVIEW

[论文解读] On a Formal Model of Safe and Scalable Self-driving Cars

Shai Shalev‐Shwartz, Shaked Shammah|arXiv (Cornell University)|Aug 21, 2017
Reinforcement Learning in Robotics参考文献 9被引用 420
一句话总结

本文介绍责任感知安全(RSS),一种正式、可验证的自动驾驶安全模型,以及一个与实际部署相一致的可扩展系统设计。

ABSTRACT

In recent years, car makers and tech companies have been racing towards self driving cars. It seems that the main parameter in this race is who will have the first car on the road. The goal of this paper is to add to the equation two additional crucial parameters. The first is standardization of safety assurance --- what are the minimal requirements that every self-driving car must satisfy, and how can we verify these requirements. The second parameter is scalability --- engineering solutions that lead to unleashed costs will not scale to millions of cars, which will push interest in this field into a niche academic corner, and drive the entire field into a "winter of autonomous driving". In the first part of the paper we propose a white-box, interpretable, mathematical model for safety assurance, which we call Responsibility-Sensitive Safety (RSS). In the second part we describe a design of a system that adheres to our safety assurance requirements and is scalable to millions of cars.

研究动机与目标

  • 提出一个基于照护义务(RSS)的白盒、可解释的自动驾驶安全模型。
  • 定义一个语义语言和规划/感知框架,以实现可扩展、可验证的安全性。
  • 展示 RSS 如何通过离线数据实现每小时行驶的目标致死概率为 10^-9。
  • 提供一个在可扩展的多车环境中实现 RSS 的系统设计。

提出的方法

  • 将 RSS 形式化为一个在多智能体环境中捕捉安全驾驶决策的数学模型。
  • 引入一个用于单位、测量与动作空间的语义语言,以连接规划、感知和执行。
  • 开发一个在语义空间上使用带有边界轨迹考量的 Q 函数的近端可扩展规划方法。
  • 提供一个基于 PAC 的感知模型,在遵循 RSS 的同时处理感知误差。
  • 展示在纵向(以及后续横向)场景中,具有定义的安全距离和适当反应规则的星形、归纳证明来证明安全性。

实验结果

研究问题

  • RQ1如何以同时符合人类法律概念(照护义务)且可验证的方式对自动驾驶汽车的安全性进行建模?
  • RQ2是否存在一个语义化、规划-感知-执行框架,能够在大规模下确保 RSS 兼容行为?
  • RQ3哪些参数选择(例如反应时间、制动/加速极限)在安全保证与交通效率之间实现平衡?
  • RQ4是否可以使用离线数据和基于 PAC 的感知来实现每小时致死概率 10^-9 的目标?
  • RQ5如何在纵向和横向驾驶场景中通过归纳、星形证明来证明多智能体安全性?

主要发现

  • RSS 提供了对照护义务的正式解释,若所有主体遵循它,则目标实现零事故(AI-Utopia)。
  • 推导出一个安全纵向距离,作为速度和加速/制动极限的函数,使对危险情况具有可证明的正确反应。
  • 该模型支持在语义空间中实现可扩展规划,轨迹数量有界,利于学习和验证。
  • 集成了一个基于 PAC 的感知模型,以在遵守 RSS 的同时处理测量误差。
  • 该方法设计为可离线验证,数据量级在约 10^5 小时驾驶经验级别,不需要异常庞大的数据。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。