Skip to main content
QUICK REVIEW

[논문 리뷰] Multi-Sound-Source Localization for Small Autonomous Unmanned Vehicles with a Self-Rotating Bi-Microphone Array.

Deepak Gala, Nathan Lindsay|arXiv (Cornell University)|2018. 04. 13.
Speech and Audio Processing참고 문헌 26인용 수 2
한 줄 요약

이 논문은 자가 회전하는 이마ics 마이크 어레이를 사용하여 이앙간 시간 차이(ITD) 신호를 추출함으로써 소형 자율 무인 차량(SAUVs)을 위한 두 가지 새로운 음원 위치 추정 방법을 제안한다. DBSCAN 및 RANSAC 기반의 접근 방식은 반향 환경에서 3차원 공간 내 다수의 음원을 성공적으로 국소화하며, 음원 수와 방향성을 정확히 추정한다.

ABSTRACT

While vision-based localization techniques have been widely studied for small autonomous unmanned vehicles (SAUVs), sound-source localization capability has not been fully enabled for SAUVs. This paper presents two novel approaches for SAUVs to perform multi-sound-sources localization (MSSL) using only the interaural time difference (ITD) signal generated by a self-rotating bi-microphone array. The proposed two approaches are based on the DBSCAN and RANSAC algorithms, respectively, whose performances are tested and compared in both simulations and experiments. The results show that both approaches are capable of correctly identifying the number of sound sources along with their three-dimensional orientations in a reverberant environment.

연구 동기 및 목표

  • 소형 자율 무인 차량(SAUVs)에서 단지 이앙간 시간 차이(ITD) 신호를 사용하여 다중 음원 위치 추정(MSSL)을 가능하게 하기.
  • 시각 기반 방법에 대한 광범위한 연구에도 불구하고 SAUVs에서의 강력한 음원 위치 추정의 부족을 해결하기.
  • DBSCAN 및 RANSAC 알고리즘을 사용하여 ITD 기반의 두 가지 MSSL 접근 방식을 개발하고 평가하여 음원 탐지 및 국소화를 향상시키기.
  • 모델의 성능을 시뮬레이션 및 실제 반향 환경 모두에서 검증하기.

제안 방법

  • 자기 회전하는 이마이크 어레이를 사용하여 이앙간 시간 차이(ITD) 신호를 캡처함으로써 외부 센서 없이도 방향성 음원 국소화를 가능하게 한다.
  • DBSCAN 알고리즘을 적용하여 ITD 데이터 포인트를 군집화함으로써 별개의 음원 방향을 식별하고 음원 수를 추정한다.
  • RANSAC 알고리즘을 사용하여 반복적으로 모델을 ITD 데이터에 적합시켜 내부 데이터 포인트를 식별함으로써 주요 음원 방향을 탐지한다.
  • 두 알고리즘 모두 반향 음향 환경에서 다수의 음원 3차원 방향을 추정하기 위해 ITD 데이터를 처리한다.
  • 복잡한 빔포밍 또는 위상 기반 처리를 피하기 위해 ITD 신호에만 의존한다.
  • 마이크 어레인지의 자가 회전으로 각도 전역에서 방향성 ITD를 샘플링함으로써 전체 구형 음원 탐지가 가능해진다.

실험 결과

연구 질문

  • RQ1자기 회전하는 이마이크 어레이가 SAUVs에서 다중 음원 국소화에 필요한 충분한 ITD 신호를 효과적으로 캡처할 수 있는가?
  • RQ2DBSCAN 및 RANSAC 알고리즘이 단지 ITD 데이터를 사용하여 다수의 음원 수와 3차원 방향을 얼마나 정확히 추정할 수 있는가?
  • RQ3기존의 전통적 방법과 비교해 볼 때 제안된 ITD 기반 방법은 반향 환경에서 어떻게 성능을 발휘하는가?
  • RQ4실제 음향 조건에서 DBSCAN 및 RANSAC 방법은 다수의 음원을 구분하는 데 얼마나 강건한가?

주요 결과

  • DBSCAN 및 RANSAC 기반 접근 방식은 자기 회전하는 이마이크 어레이에서 얻은 ITD 신호만을 사용하여 3차원 공간 내 다수의 음원을 성공적으로 국소화하였다.
  • 모델은 시뮬레이션 및 실제 실험 모두에서 음원 수를 정확히 추정하였다.
  • 알고리즘은 반향 환경에서도 강력한 성능을 보이며, 정확한 음원 방향 추정을 유지하였다.
  • 자기 회전하는 이마이크 어레인지 덕분에 추가 센서나 복잡한 신호 처리 없이도 전체 구형 음원 탐지가 가능했다.
  • 결과적으로 ITD 기반 국소화가 군집화 및 모델 적합 기법과 결합될 경우 소형 자율 무인 차량에서 실현 가능하다는 것이 확인되었다.
  • 두 접근 방식의 성능은 시뮬레이션 및 물리적 환경 모두에서 비교 테스트를 통해 검증되었으며, 일관된 국소화 정확도를 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.