[论文解读] Robust Audio-Based Vehicle Counting in Low-to-Moderate Traffic Flow
本文提出一种基于音频的鲁棒车辆计数方法,适用于低至中等流量的交通场景,仅使用单个麦克风。该方法将车辆计数建模为回归问题,以预测车辆与麦克风之间的距离,通过检测预测距离函数中的极小值来识别经过的车辆。该方法在广泛检测阈值范围内均实现低于2%的相对车辆计数误差,即使在未见过的地点测试时也表现优异,且引入的高频能量特征显著提升了在噪声环境下的性能。
The paper presents a method for audio-based vehicle counting (VC) in low-to-moderate traffic using one-channel sound. We formulate VC as a regression problem, i.e., we predict the distance between a vehicle and the microphone. Minima of the proposed distance function correspond to vehicles passing by the microphone. VC is carried out via local minima detection in the predicted distance. We propose to set the minima detection threshold at a point where the probabilities of false positives and false negatives coincide so they statistically cancel each other in total vehicle number. The method is trained and tested on a traffic-monitoring dataset comprising $422$ short, $20$-second one-channel sound files with a total of $ 1421 $ vehicles passing by the microphone. Relative VC error in a traffic location not used in the training is below $ 2 \%$ within a wide range of detection threshold values. Experimental results show that the regression accuracy in noisy environments is improved by introducing a novel high-frequency power feature.
研究动机与目标
- 开发一种低成本、非侵入式的单通道音频车辆计数系统,适用于低至中等流量的交通场景。
- 解决真实交通监控中常见的噪声环境和变化的声学条件带来的挑战。
- 通过引入新型声学特征,提升车辆与麦克风距离预测的回归准确性。
- 确保在不同检测阈值和未见地点下,车辆计数的稳定性和准确性。
提出的方法
- 该方法将车辆计数建模为回归任务,以预测车辆与麦克风之间的距离。
- 通过局部极小值检测方法识别预测距离函数中的极小值,将其作为经过的车辆。
- 引入一种新型高频能量(HFP)特征,以增强在噪声环境下的鲁棒性。
- 检测阈值设定为使误报率与漏报率平衡的点,以最小化总计数误差。
- 模型在自建的数据集上进行训练和测试,该数据集包含422段单通道音频片段(每段20秒),共标注1,421辆车辆。
- 通过NAUC和EFP指标评估特征组合,消融实验识别出HFP+LMS为最优组合。
实验结果
研究问题
- RQ1能否在低至中等流量场景下,仅使用单个麦克风,使基于音频的车辆计数方法对环境噪声具有鲁棒性?
- RQ2与传统基于能量的方法相比,基于回归的距离预测在多大程度上能提升车辆计数的准确性?
- RQ3何种特征组合能在不同检测阈值下实现最大鲁棒性并最小化误差?
- RQ4与标准特征相比,所提出的高频能量特征是否能提升在噪声条件下的性能?
- RQ5该方法在具有不同声学特性的未见交通地点上泛化能力如何?
主要发现
- 在未见地点测试时,该方法在宽检测阈值范围(74%Td至85%Td)内实现了低于2%的相对车辆计数误差(RVCE)。
- 最优特征组合HFP+LMS实现了最低的EFP(4.43%)和NAUC为0.772,优于所有其他组合。
- HFP特征显著提升了对环境噪声的鲁棒性,相比STE和TRF,减少了虚假峰值。
- 当在五个地点训练并在第六个带噪声屏障的地点测试时,HFP+LMS组合保持了最低的EFP(6.55%)和0.52%的RVCE(在EFP阈值下)。
- 该方法表现出高度泛化能力,在10%的阈值范围内RVCE始终低于2%,表明在不同检测灵敏度设置下具有稳定性。
- 消融实验确认LMS是最重要的特征,且HFP+LMS在NAUC和EFP两个指标上均优于所有其他组合。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。