[论文解读] The Combination of Several Decorrelation Methods to Improve Acoustic Feedback Cancellation
这项研究在基于频域卡尔曼滤波的声学反馈消除系统中加入多种去相关化方法(可变时延、预测、失真和混响建模),并证明它们的组合使用在公开数据集上可提升 PESQ 和系统距离等指标。
This paper extends an acoustic feedback cancellation system by incorporating multiple decorrelation methods. The baseline system is based on a frequency-domain Kalman filter implemented in a multi-delay structure. The proposed extensions include a variable time delay line, prediction, distortion compensation, and a simplified reverberation model. Each extension is analyzed, and a practical parameter range is defined. While existing literature often focuses on a single extension, such as prediction, to describe an optimal system, this work demonstrates that each individual extension contributes to performance improvements. Furthermore, the combination of all proposed extensions results in a superior system. The evaluation is conducted using publicly available datasets, with performance assessed through system distance metrics and the objective speech quality measure PSEQ.
研究动机与目标
- 在汽车通信等语音系统中解决声学反馈消除问题。
- 在基线 MD-FLMS/卡尔曼滤波结构基础上增加多种去相关化扩展。
- 量化每个扩展的单独与组合对收敛性和语音质量的影响。
- 为各扩展建立可行的参数范围。
- 利用公开数据集和客观指标(PESQ、系统距离、溢出)验证改进。
提出的方法
- 从在多延迟结构(MD-FLMS)中的频域卡尔曼滤波开始。
- 增加去相关化扩展:定/变时延(颤音)、预测、非线性失真,以及简化的混响模型(能量衰减算子)。
- 基于 L2-范数的系统距离 sd(l) 来衡量收敛,并引入早期 sd5 和晚期 sd20+ 指标。
- 以 PESQ 作为语音质量指标进行评估,并在一系列环路增益 g(0、6、12、30 dB)范围内分析,采用斜坡门控以防止不稳定。
- 将时延变量参数化,最大时延 ~2 ms,调制频率 ~1–2 Hz;使用低阶预测器(Np=2 或 4);比较非线性曲线和 THD 设置(5–10%)。
- 在公开的 Lombard 语音数据和 ANIR 汽车脉冲响应上进行测试,采样率 16 kHz,四种增益设置,男性和女性语音分别取均值。
实验结果
研究问题
- RQ1单个去相关化扩展是否相对基线改进了性能?
- RQ2将多种去相关方法结合是否优于单一方法扩展?
- RQ3每个扩展的实际参数范围如何在 PESQ、收敛速度和溢出之间取得平衡?
- RQ4在公开的语音和脉冲响应数据集(Lombard 和 ANIR)上,在不同环路增益下扩展的表现如何?
- RQ5颤音相对预测及其他扩展对系统收敛性和语音质量的影响有何相对贡献?
主要发现
- 每个去相关化扩展都对基线有性能提升。
- 可变时延(颤音)提供最显著的改进,其次是预测。
- 将颤音与预测结合在 PESQ 和系统距离指标上均表现更优。
- 非线性失真提高了收敛距离,但在较高 THD 时可能略微降低 PESQ;控制在约 5% 的 THD 可以取得平衡。
- 一个简单的混响模型(曲线拟合)在自适应稳定性上有帮助,并在与其他扩展一起使用时进一步改善结果。
- 在公开数据上,所有扩展的完整组合实现最佳整体性能,在 30 dB 增益时溢出极低(极少发生)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。