Skip to main content
QUICK REVIEW

[论文解读] BigSUMO: A Scalable Framework for Big Data Traffic Analytics and Parallel Simulation

Rahul Sengupta, Nooshin Yousefzadeh|arXiv (Cornell University)|Jan 5, 2026
Traffic Prediction and Management Techniques被引用 0
一句话总结

BigSUMO 是一个端到端的开源框架,使用 ATSPM 和稀疏轨迹数据进行城市尺度分析与并行基于 SUMO 的仿真,实现描述性分析、中断检测与处方性交通优化。

ABSTRACT

With growing urbanization worldwide, efficient management of traffic infrastructure is critical for transportation agencies and city planners. It is essential to have tools that help analyze large volumes of stored traffic data and make effective interventions. To address this need, we present ``BigSUMO", an end-to-end, scalable, open-source framework for analytics, interruption detection, and parallel traffic simulation. Our system ingests high-resolution loop detector and signal state data, along with sparse probe trajectory data. It first performs descriptive analytics and detects potential interruptions. It then uses the SUMO microsimulator for prescriptive analytics, testing hundreds of what-if scenarios to optimize traffic performance. The modular design allows integration of different algorithms for data processing and outlier detection. Built using open-source software and libraries, the pipeline is cost-effective, scalable, and easy to deploy. We hope BigSUMO will be a valuable aid in developing smart city mobility solutions.

研究动机与目标

  • 提供一个端到端、可扩展的 ATSPM 与稀疏轨迹数据分析与仿真管线。
  • 通过交互式笔记本提供描述性分析,通过并行 SUMO 仿真实现处方性分析。
  • 实现来自多数据源的中断检测,并支持干预的反事实分析。
  • 利用开源组件实现云部署和广泛可访问性。
  • 演示在智慧城市出行解决方案中的应用工作流与潜在使用场景。

提出的方法

  • 获取 ATSPM 与稀疏轨迹数据,并应用描述性分析以提取等待时间、转向动作、排队长度和制动事件。
  • 从 GIS 数据中生成空间掩模以裁剪轨迹,并使用 GeoPandas 与 MovingPandas 进行数据预处理。
  • 通过在 PyOD 的 ABOD 中将基于 ATSPM 的和基于轨迹的离群分析结合,检测中断,应用于并行路口。
  • 对数百个 SUMO 微观仿真进行并行标定,以评估反事实交通干预。
  • 使用底图和 OD/转向动作来标定流量和速度,以实现现实的 SUMO 仿真,利用 routeSampler 进行交通生成。
  • 在普通 CPU 上执行并行仿真,产出用于模型训练与评估的大规模数据。

实验结果

研究问题

  • RQ1如何将 ATSPM 与稀疏轨迹数据整合,以产生城市尺度的描述性与处方性交通分析?
  • RQ2在可扩展管线中,使用异构数据源检测交通中断的有效方法有哪些?
  • RQ3在不同参数下的并行 SUMO 微观仿真是否能够可靠地支持反事实分析和干预规划?
  • RQ4为使仿真与观测交通行为对齐,需要哪些预处理、掩模和标定步骤?
  • RQ5该框架如何为交通领域的深度学习模型(如时空图模型)提供数据生成支持?

主要发现

  • BigSUMO 管线在端到端处理(包括裁剪、分析、向量化和离群检测)方面,单个路口约需 2–3 分钟墙钟时间。
  • 基于轨迹的中断检测是可行且与基于 ATSPM 的检测互为补充,拥有并行化能力,可在普通 CPU 上对多路口进行分析。
  • 基于 SUMO 的处方性分析可以并行执行数百个仿真,以探索走廊优化的反事实情景。
  • 标定的底图、OD 矩阵和速度分布使 SUMO 仿真更具现实性,且能更快收敛到观测到的交通模式。
  • 该框架支持为深度学习数据生成,包含用于时空交通动力学的图结构模型。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。