Skip to main content
QUICK REVIEW

[论文解读] Modal locking between vocal fold and vocal tract oscillations

Atte Aalto, Daniel Aalto|arXiv (Cornell University)|Nov 20, 2012
Speech and Audio Processing被引用 5
一句话总结

本研究通过建模声道声学反馈至声带振动的机制,探究了语音产生中的非线性声源-滤波器耦合。仿真与实验结果表明,当音高滑动跨越第一共振峰(F1)时,声带与声道动力学之间会产生模式锁定——即持续的同步现象,且仿真中的效应强于人类数据,提示人类存在主动的生理补偿机制。

ABSTRACT

The human vocal folds are known to interact with the vocal tract acoustics during voiced speech production; namely a nonlinear source-filter coupling has been observed both by using models and in \emph{in vivo} phonation. These phenomena are approached from two directions in this article. We first present a computational dynamical model of the speech apparatus that contains an explicit filter-source feedback mechanism from the vocal tract acoustics back to the vocal folds oscillations. The model was used to simulate vocal pitch glideswhere the trajectory was forced to cross the lowest vocal tract resonance, i.e., the lowest formant $F_1$. Similar patterns produced by human participants were then studied. Both the simulations and the experimental results reveal an effect when the glides cross the first formant (as may happen in extipa{[i]}). Conversely, this effect is not observed if there is no formant within the glide range (as is the case in extipa{[ extscripta]}). The experiments show smaller effect compared to the simulations, pointing to an active compensation mechanism.

研究动机与目标

  • 探究声道声学在元音语音期间调节声带振动的作用。
  • 建立声道共振反馈至声带动力学的机制模型。
  • 比较仿真中声带行为与人类发音在音高滑动跨越F1时的实验数据。
  • 识别共振峰跨越是否在语音产生中引发可观察到的同步(模式锁定)。
  • 探讨仿真结果与人类实验数据之间的差异,提示人类存在主动补偿机制。

提出的方法

  • 开发了包含显式声源-滤波器反馈的语音装置计算动力学模型。
  • 引入反馈回路,使声道声学影响声带振动频率与振幅。
  • 模拟了跨越第一共振峰(F1)的音高滑动,模拟自然语音过渡。
  • 对人类受试者开展实验,使其产生类似的音高滑动,记录声带与声道动力学。
  • 采用时频分析与互相关方法分析声带与声道振动之间的同步模式。
  • 将仿真结果与实验数据对比,评估模式锁定的存在性与强度。

实验结果

研究问题

  • RQ1当音高滑动跨越第一共振峰(F1)时,是否会在声带与声道振动之间引发可测量的同步?
  • RQ2仿真中的模式锁定强度与人类发音相比如何?
  • RQ3主动生理补偿在人类说话者中如何减少观测到的锁定效应?
  • RQ4语音产生中的声源-滤波器耦合更应被描述为被动反馈机制,还是主动控制过程?
  • RQ5滑动范围的变化(是否包含F1跨越)如何影响模式锁定的出现?

主要发现

  • 当音高滑动跨越第一共振峰(F1)时,如在元音[i]中,可观察到声带与声道振动之间的模式锁定。
  • 当滑动范围不包含F1时,如在元音[a]中,该效应消失,证实共振峰共振在触发同步中的关键作用。
  • 仿真显示的模式锁定强于人类实验,表明该差异可能源于人类说话者的主动补偿。
  • 已确认声道声学反馈至声带是语音产生中非线性耦合的关键驱动力。
  • 结果支持人类存在主动控制机制,可减少或调节模型中观测到的声源-滤波器耦合效应。
  • 本研究证明,共振峰跨越是语音产生系统中动态同步的关键触发因素。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。