QUICK REVIEW

[论文解读] Agnostic Lane Detection

Yuenan Hou|arXiv (Cornell University)|May 2, 2019

Autonomous Vehicle Technology and Safety参考文献 13被引用 21

一句话总结

本文提出了一种无偏见的车道检测框架，将车道检测视为实例分割任务，从而在车道数量变化和变道场景下均表现出鲁棒性能。通过结合多任务学习（可行驶区域检测与车道点回归）、特征金字塔结构以及轻量级 ENet 主干网络，该方法在 TuSimple 和 CULane 基准测试中实现了实时推理，兼具最先进的效率与具有竞争力的准确率。

ABSTRACT

Lane detection is an important yet challenging task in autonomous driving, which is affected by many factors, e.g., light conditions, occlusions caused by other vehicles, irrelevant markings on the road and the inherent long and thin property of lanes. Conventional methods typically treat lane detection as a semantic segmentation task, which assigns a class label to each pixel of the image. This formulation heavily depends on the assumption that the number of lanes is pre-defined and fixed and no lane changing occurs, which does not always hold. To make the lane detection model applicable to an arbitrary number of lanes and lane changing scenarios, we adopt an instance segmentation approach, which first differentiates lanes and background and then classify each lane pixel into each lane instance. Besides, a multi-task learning paradigm is utilized to better exploit the structural information and the feature pyramid architecture is used to detect extremely thin lanes. Three popular lane detection benchmarks, i.e., TuSimple, CULane and BDD100K, are used to validate the effectiveness of our proposed algorithm.

研究动机与目标

解决传统车道检测方法因假设车道数量固定而在变道场景下失效的局限性。
在遮挡、光照不良及标记模糊等挑战性条件下提升模型的泛化能力与鲁棒性。
通过采用轻量级网络主干（ENet）与高效架构设计，实现实时推理。
通过多任务学习，利用可行驶区域与消失点的结构与上下文信息，增强结构感知能力。
通过特征金字塔架构实现对极细车道的检测。

提出的方法

该方法将车道检测分解为两个子任务：二值分割（车道与背景）和实例分类（将每个车道像素分配至唯一车道实例）。
采用多任务学习范式，集成三个分支：二值分割、可行驶区域检测与车道点回归，以增强结构感知能力。
使用特征金字塔网络（FPN）通过融合主干网络的多尺度特征，实现对细长车道的检测。
采用 ENet 主干网络以实现实时性能，最大限度减少模型参数量与推理时间。
通过像素嵌入生成实例级预测，随后进行聚类以将像素分组为不同的车道实例。
损失函数结合了二值交叉熵损失（用于分割）、焦点损失（用于实例分类）与平滑L1损失（用于点回归）。

实验结果

研究问题

RQ1能否通过超越固定类别语义分割的方式，使车道检测在车道数量可变及变道场景下具备鲁棒性？
RQ2可行驶区域与消失点提供的结构与上下文线索在多大程度上能提升车道检测性能？
RQ3像 ENet 这类轻量级网络是否能在复杂城市道路场景下实现实时推理并保持高准确率？
RQ4特征金字塔架构在多大程度上提升了对细长或断裂车道标记的检测能力？
RQ5通过可行驶区域与车道点的联合监督进行多任务学习，是否能增强模型的泛化能力与鲁棒性？

主要发现

在 TuSimple 基准测试中，所提出的基于 ENet 的模型达到了 96.29% 的准确率，尽管参数量仅为 0.98M，与参数更复杂的 SCNN（96.53%）相比表现相当。
在 CULane 上，模型总体 F1 分数达到 68.8%，在参数效率与推理速度方面优于 ResNet-101（70.8%）与 SCNN（71.6%）。
模型展现出卓越的推理效率，在 CULane 上运行时间仅为 13.4ms，显著快于 SCNN（133.5ms）与 ResNet-101（171.2ms）。
在夜间（61.4%）、阴影（63.4%）及无车道线（42.9%）等挑战性类别中表现优异，表明对视觉退化具有强鲁棒性。
消融实验证实，结合可行驶区域与点回归的多任务学习显著提升了 CULane 所有类别下的性能。
特征金字塔架构有助于提升对细长车道的检测能力，尤其在复杂密集场景中表现更优。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。