[논문 리뷰] Wavelet-Filtering of Symbolic Music Representations for Folk Tune Segmentation and Classification
본 논문은 상징적 민속 멜로디에 대한 Haar-wavelet 필터링을 이용해 곡을 구분하고 tune families로 분류하는 것을 평가하고, 시간 스케일과 매개변수를 최적화했을 때 정확도가 향상됨을 Gestalt 기반 방법과 비교하여 보여준다.
The aim of this study is to evaluate a machine-learning method in which symbolic representations of folk songs are segmented and classified into tune families with Haar-wavelet filtering. The method is compared with previously proposed Gestalt-based method. Melodies are represented as discrete symbolic pitch-time signals. We apply the continuous wavelet transform (CWT) with the Haar wavelet at specific scales, obtaining filtered versions of melodies emphasizing their information at particular time-scales. We use the filtered signal for representation and segmentation, using the wavelet coefficients' local maxima to indicate local boundaries and classify segments by means of k-nearest neighbours based on standard vector-metrics (Euclidean, cityblock), and compare the results to a Gestalt-based segmentation method and metrics applied directly to the pitch signal. We found that the wavelet based segmentation and wavelet-filtering of the pitch signal lead to better classification accuracy in cross-validated evaluation when the time-scale and other parameters are optimized.
연구 동기 및 목표
- 상징 표현을 사용한 민속 tunes의 분할 및 분류를 개선하려는 동기를 부여한다.
- 로컬 경계를 감지하기 위한 계수 최대값을 이용한 wavelet 기반 접근법(Haar-CWT)을 평가한다.
- 표준 벡터 거리로 k-최근접 이웃을 사용하여 구간을 분류한다.
- Gestalt 기반 분할 방법과 wavelet 기반 분할/분류를 비교한다.
- 시간 스케일 선택과 매개변수 최적화가 성능에 미치는 영향을 평가한다.
제안 방법
- 멜로디를 이산적 기호 피치-시간 신호로 표현한다.
- 선택된 스케일에서 Haar 웨이브렛으로 연속 웨이브렛 변환(CWT)을 적용하여 스케일 필터링된 신호를 얻는다.
- 지역 최대값에서 로컬 경계를 식별한다.
- 필터링된 신호를 사용하여 구간을 표현하고 유클리드 거리, 시티블록 거리의 k-최근접 이웃으로 분류한다.
- wavelet 기반의 분할/분류를 Gestalt 기반 분할 방법 및 피치 신호에 직접 적용된 지표와 비교한다.
- 시간 스케일과 매개변수가 최적화될 때 성능을 평가하기 위한 교차 검증 평가를 사용한다.
실험 결과
연구 질문
- RQ1Haar-wavelet 필터링이 기초 방법에 비해 상징적 민속 음악 멜로디의 구분을 개선할 수 있는가?
- RQ2웨이브렛으로 필터링된 표현이 Gestalt 기반 방법에 비해 튠 패밀리 분류 정확도를 향상시키는가?
- RQ3선택한 시간 스케일과 필터 매개변수가 구분 경계 및 분류 성능에 어떤 영향을 미치는가?
- RQ4표준 거리 메트릭을 이용한 kNN이 wavelet 유도 특징에서 기저 표현에 비해 어떻게 성능을 보이는가?
주요 결과
- Time-scale 및 매개변수를 최적화했을 때 교차 검증 평가에서 웨이브렛 기반 구분 및 피치 신호의 웨이브렛 필터링이 더 나은 분류 정확도를 준다.
- 이 방법은 웨이브렛 계수의 최대값을 통해 로컬 경계에 중점을 두고 구간 분류에 kNN을 사용한다.
- Gestalt 기반 구분과 비교할 때 매개변수를 적절히 조정하면 웨이브렛 접근 방식의 성능이 향상된다.
- 본 연구는 민속 멜로디의 상징적 표현과 표준 거리 지표를 사용한 경험적 근거를 제공한다.
- 결과는 FMA2013 맥락에서 일곱 페이지, 네 개의 그림, 두 개의 표를 포함하여 보고된다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.