Skip to main content
QUICK REVIEW

[논문 리뷰] A Machine Learning Driven IoT Solution for Noise Classification in Smart Cities

Yasser Alsouda, Sabri Pllana|arXiv (Cornell University)|2018. 09. 01.
Music and Audio Processing참고 문헌 9인용 수 24
한 줄 요약

이 논문은 스마트 시티에서 실시간 환경 소음 분류를 위한 저비용·저전력 IoT 솔루션을 제시한다. 라즈베리 파이 제로 W를 사용하며, 음성 특징 추출에 멜 주파수 체르스탈 계수(MFCCs)를 적용하고, SVM 및 KNN 분류기 성능을 평가하여 기기에서 1초 이내의 추론 시간으로 85–100%의 정확도를 달성한다.

ABSTRACT

We present a machine learning based method for noise classification using a low-power and inexpensive IoT unit. We use Mel-frequency cepstral coefficients for audio feature extraction and supervised classification algorithms (that is, support vector machine and k-nearest neighbors) for noise classification. We evaluate our approach experimentally with a dataset of about 3000 sound samples grouped in eight sound classes (such as, car horn, jackhammer, or street music). We explore the parameter space of support vector machine and k-nearest neighbors algorithms to estimate the optimal parameter values for classification of sound samples in the dataset under study. We achieve a noise classification accuracy in the range 85% -- 100%. Training and testing of our k-nearest neighbors (k = 1) implementation on Raspberry Pi Zero W is less than a second for a dataset with features of more than 3000 sound samples.

연구 동기 및 목표

  • 스마트 시티에서 지속적인 환경 소음 모니터링을 위한 저비용·저에너지 효율적인 IoT 솔루션을 개발하기 위해.
  • 기존의 소음 수준 측정 방식(데시벨 기반)의 한계를 보완하기 위해, 철거기나 총성과 같은 소음 유형을 분류하기 위해.
  • 저자원 임베디드 플랫폼(Raspberry Pi Zero W)에서 기계 학습 기반의 소음 분류를 구현하고 평가하기 위해.
  • 실제 도시 음향 데이터셋에서 SVM 및 KNN의 초모수를 최적화하여 최대 분류 정확도를 달성하기 위해.
  • KNN(k=1)의 경우 학습 및 테스트 시간이 모두 1초 이내로 실시간 성능을 입증하기 위해.

제안 방법

  • 환경 음향 샘플에서 스펙트럼 특성을 강건하게 표현하기 위해 멜 주파수 체르스탈 계수(MFCCs)를 음성 특징으로 추출한다.
  • 지능형 학습을 적용하여 지정된 8개의 사전 클래스로 소리를 분류하기 위해 서포트 벡터 머신(SVM) 및 k-최근접 이웃(KNN) 분류기를 사용한다.
  • 모든 초모수 공간 탐색을 통해 SVM 초모수(C 및 γ)와 KNN 초모수(k, 거리 측정법: 유클리드, 맨하탄, 체비셰프)를 최적화한다.
  • 저전력 및 저비용 특성을 활용하여, 라즈베리 파이 제로 W에 시스템을 구현하고 엣지 배포를 구현한다.
  • 유저노이즈8K 및 사운드 이벤트에서 유래한 3,042개의 환경 음향 샘플 데이터셋을 사용하며, 자동차 경적, 철거기, 거리 음악, 총성 등의 클래스를 포함한다.
  • 혼동 행렬, 분류 정확도, 임베디드 플랫폼에서의 학습/테스트 추론 시간을 통해 성능을 측정한다.

실험 결과

연구 질문

  • RQ1라즈베리 파이 제로 W와 같은 저전력 IoT 기기에서 실생활 환경 음향에 기반한 기계 학습을 사용해 실시간 소음 분류가 가능한가?
  • RQ2도시 소음 유형을 MFCC 특징에서 분류하기 위해 SVM 및 KNN의 최적 초모수 조합(C, γ, k, 거리 측정법)은 무엇인가?
  • RQ3실생활 도시 음향 데이터셋에서 SVM 및 KNN의 분류 정확도는 다양한 소음 유형 간에 어떻게 달라지나?
  • RQ4라즈베리 파이 제로 W에서 3,042개의 음성 샘플로 구성된 데이터셋에 대해 KNN 및 SVM의 추론 시간 성능은 어떠한가?
  • RQ5MFCC 기반 특징 추출과 경량 분류기의 조합이 단순한 데시벨 수준 모니터링을 넘어서 정확한 소음 유형 식별을 가능하게 하는가?

주요 결과

  • 제안된 시스템은 SVM 및 KNN 분류기를 사용하여 모든 8개의 소리 클래스에서 85%에서 100%의 분류 정확도를 달성하였다.
  • KNN의 경우 k=1일 때 가장 높은 정확도를 기록했으며, k가 증가할수록 성능이 저하되어 이 데이터셋에서는 국소 이웃 정보가 가장 효과적임을 시사한다.
  • 이 데이터셋에 최적화된 SVM 초모수는 C=3 및 γ=0.1로, 가장 높은 분류 정확도를 제공하였다.
  • 라즈베리 파이 제로 W에서 k=1인 KNN 모델의 전체 3,042개 샘플에 대한 학습 및 테스트 시간은 1초 이내였다.
  • k=1인 KNN 모델은 가장 빠른 추론 시간(테스트 시 0.21초)을 기록했으며, SVM의 학습 시간은 C 및 γ 값에 따라 4.29~35.32초의 범위를 보였다.
  • 혼동 행렬 분석 결과, 일부 클래스(예: 거리 음악 및 자동차 경적)는 더 잘 분류되지 않았지만, 전반적으로 모든 클래스에서 강력한 모델 성능을 유지하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.