Skip to main content
QUICK REVIEW

[論文レビュー] Multi-Sound-Source Localization for Small Autonomous Unmanned Vehicles with a Self-Rotating Bi-Microphone Array.

Deepak Gala, Nathan Lindsay|arXiv (Cornell University)|Apr 13, 2018
Speech and Audio Processing参考文献 26被引用数 2
ひとこと要約

本稿では、自己回転する二マイクロホンアレイを用いて間甲逓度差(ITD)信号を抽出することで、小型自律無人車両(SAUVs)向けに二つの新規な音源局所化手法を提案する。DBSCANおよびRANSACに基づく手法は、反響環境下でも3次元空間において複数の音源を的確に局所化し、音源数と方向性を正確に推定した。

ABSTRACT

While vision-based localization techniques have been widely studied for small autonomous unmanned vehicles (SAUVs), sound-source localization capability has not been fully enabled for SAUVs. This paper presents two novel approaches for SAUVs to perform multi-sound-sources localization (MSSL) using only the interaural time difference (ITD) signal generated by a self-rotating bi-microphone array. The proposed two approaches are based on the DBSCAN and RANSAC algorithms, respectively, whose performances are tested and compared in both simulations and experiments. The results show that both approaches are capable of correctly identifying the number of sound sources along with their three-dimensional orientations in a reverberant environment.

研究の動機と目的

  • 小型自律無人車両(SAUVs)において、間甲逓度差(ITD)信号のみを用いて複数音源局所化(MSSL)を可能にすること。
  • 視覚ベースの手法に関する広範な研究にもかかわらず、SAUVsにおける頑健な音源局所化の欠如に取り組むこと。
  • DBSCANおよびRANSACアルゴリズムを用いて、ITDに基づく二つのMSSL手法を開発・評価し、より優れた音源検出および局所化を実現すること。
  • 両手法の性能を、シミュレーション環境および実世界の反響環境において検証すること。

提案手法

  • 自己回転する二マイクロホンアレイを用いて間甲逓度差(ITD)信号を取得し、外部センサーを必要とせずに方向音源局所化を実現する。
  • DBSCANアルゴリズムを用いてITDデータポイントをクラスタリングし、明確な音源方向を特定するとともに音源数を推定する。
  • RANSACアルゴリズムを用いて、ITDデータに対してモデルを繰り返し適合させ、内側点を同定することで、支配的音源方向を特定する。
  • 両アルゴリズムが反響音響環境下で、複数音源の3次元方向を推定するためにITDデータを処理する。
  • 複雑なビームフォーミングや位相ベースの処理を避けるため、両手法はITD信号にのみ依存する。
  • マイクロホンアレイの自己回転により、全方向のITDを角度ごとにサンプリングすることで、球面的音源検出が可能になる。

実験結果

リサーチクエスチョン

  • RQ1自己回転する二マイクロホンアレイは、SAUVsにおける複数音源局所化に十分なITD信号を効果的に取得できるか?
  • RQ2DBSCANおよびRANSACアルゴリズムは、ITDデータのみを用いて、複数音源の数と3次元方向をどれほど正確に推定できるか?
  • RQ3提案手法のITDベースの手法は、従来の手法と比較して反響環境下でどのように性能を発揮するか?
  • RQ4DBSCANおよびRANSAC手法は、現実的な音響条件下で複数音源を区別する上でどれほど頑健か?

主な発見

  • DBSCANおよびRANSACに基づく両手法は、自己回転する二マイクロホンアレイからのITD信号のみを用いて、3次元空間における複数音源を的確に局所化した。
  • 両手法は、シミュレーションおよび実世界の実験の両方で音源数を正確に推定した。
  • アルゴリズムは反響環境下でも頑健な性能を示し、正確な音源方向推定を維持した。
  • 自己回転する二マイクロホンアレイにより、追加のセンサーや複雑な信号処理を必要とせずに、球面的音源検出が可能になった。
  • 結果から、クラスタリングおよびモデル適合技術と組み合わせたITDベースの局所化が、小型自律無人車両において実現可能であることが確認された。
  • 両手法の性能は、シミュレーション環境および物理的環境での比較試験を通じて検証され、一貫した局所化精度を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。