Skip to main content
QUICK REVIEW

[論文レビュー] Comparison of Speech Activity Detection Techniques for Speaker Recognition

Md Sahidullah, Goutam Saha|arXiv (Cornell University)|Oct 1, 2012
Speech Recognition and Synthesis参考文献 28被引用数 25
ひとこと要約

この論文は、NIST音声コーパスを用いて、クリアな状態とノイズのある状態の下で、話者認識における音声活動検出(SAD)技術の性能を評価している。ノイズ環境下でも他の手法よりも優れた性能を示す2つのガウスモデルベースのSADが、GMM-UBM分類器と統合された場合に特に優れていることが判明した。

ABSTRACT

Speech activity detection (SAD) is an essential component for a variety of speech processing applications. It has been observed that performances of various speech based tasks are very much dependent on the efficiency of the SAD. In this paper, we have systematically reviewed some popular SAD techniques and their applications in speaker recognition. Speaker verification system using different SAD technique are experimentally evaluated on NIST speech corpora using Gaussian mixture model- universal background model (GMM-UBM) based classifier for clean and noisy conditions. It has been found that two Gaussian modeling based SAD is comparatively better than other SAD techniques for different types of noises.

研究の動機と目的

  • 異なる音声活動検出(SAD)技術が話者認識性能に与える影響を評価すること。
  • クリアな状態とノイズのある音声環境下でのSADの有効性を評価すること。
  • 話者認証システムに使用する際、最も頑健なSAD手法を特定すること。
  • 標準化されたGMM-UBM分類器フレームワークを用いて、さまざまなSAD技術の性能を比較すること。

提案手法

  • 本研究では、コア分類器としてGMM-UBMベースの話者認証システムを採用している。
  • 複数のSAD技術が、入力音声の音声領域と非音声領域を分離するために適用されている。
  • 2つのガウスモデルベースのSADが比較のベンチマークとして実装されている。
  • 実験は、クリアな状態とノイズのある状態の両方でNIST音声コーパスを用いて実施されている。
  • 性能は標準的な話者認識指標を用いて評価され、SADの出力がGMM-UBM分類器の条件付けに使用されている。
  • SAD技術は、話者認証精度への影響に基づいて体系的に比較されている。

実験結果

リサーチクエスチョン

  • RQ1クリアな音声条件下で、どのSAD技術が最も高い話者認証精度を達成するか?
  • RQ2さまざまなSAD手法は、劣化(ノイズあり)音声条件下でどのように性能を示すか?
  • RQ32つのガウスモデルベースのSADは、ノイズへの耐性という観点で、他のSAD手法を上回るか?
  • RQ4SADの選択は、GMM-UBM話者認証システム全体の性能にどのように影響を与えるか?

主な発見

  • 2つのガウスモデルベースのSAD手法は、クリアな状態とノイズのある状態の両方で、他のSAD手法よりも優れた性能を示した。
  • このSAD手法は、音声コーパス内のさまざまな種類の背景ノイズに対しても、より高い頑健性を示した。
  • 話者認証精度の向上は、特にノイズ環境下で顕著に見られた。
  • 他のSAD手法はノイズレベルが上昇するにつれて有効性が低下する一方、2つのガウスモデル手法は安定した性能を維持した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。