Skip to main content
QUICK REVIEW

[論文レビュー] Wavelet-Filtering of Symbolic Music Representations for Folk Tune Segmentation and Classification

Gissel Velarde, Tillman Weyde|ArXiv.org|Apr 29, 2025
Music and Audio Processing参考文献 30被引用数 3
ひとこと要約

この論文は、象徴的な民謡の旋律に対する Haar ウェーブレットフィルタリングを用いて曲のセグメンテーションと旋律ファミリーへの分類を行い、Gestalt ベースの方法と比較して、時系列スケールとパラメータを最適化した場合に精度が向上することを示す。

ABSTRACT

The aim of this study is to evaluate a machine-learning method in which symbolic representations of folk songs are segmented and classified into tune families with Haar-wavelet filtering. The method is compared with previously proposed Gestalt-based method. Melodies are represented as discrete symbolic pitch-time signals. We apply the continuous wavelet transform (CWT) with the Haar wavelet at specific scales, obtaining filtered versions of melodies emphasizing their information at particular time-scales. We use the filtered signal for representation and segmentation, using the wavelet coefficients' local maxima to indicate local boundaries and classify segments by means of k-nearest neighbours based on standard vector-metrics (Euclidean, cityblock), and compare the results to a Gestalt-based segmentation method and metrics applied directly to the pitch signal. We found that the wavelet based segmentation and wavelet-filtering of the pitch signal lead to better classification accuracy in cross-validated evaluation when the time-scale and other parameters are optimized.

研究の動機と目的

  • 象徴表現を用いた民謡の改良されたセグメンテーションと分類を動機づける。
  • 係数の最大を用いた局所境界を検出するためのウェーブレット基底変換 Haar-CWT を評価する。
  • 標準的なベクトル距離を用いた k 最近傍法でセグメントを分類する。
  • ウェーブレットベースのセグメンテーション方法を Gestalt ベースのセグメンテーション方法と比較する。
  • 時-scale の選択とパラメータの最適化が性能に与える影響を評価する。

提案手法

  • 旋律を離散的な象徴的音高‐時間信号として表現する。
  • 選択したスケールで Haar ウェーブレットを用いた連続ウェーブレット変換 (CWT) を適用し、スケールフィルタリング信号を得る。
  • ウェーブレット係数の局所最大値から局所境界を同定する。
  • フィルタされた信号を用いてセグメントを表現し、k 最近傍法(ユークリッド距離、cityblock)で距離を測って分類する。
  • ウェーブレットベースのセグメンテーション/分類を Gestalt ベースのセグメンテーション法および音高信号そのものに直接適用した指標と比較する。
  • 時-scale とパラメータを最適化した場合の性能を評価するために交差検証を用いる。

実験結果

リサーチクエスチョン

  • RQ1 Haar ウェーブレットフィルタリングはベースライン手法と比較して象徴的な民謡のセグメンテーションを改善できるか?
  • RQ2ウェーブレットでフィルタリングした表現は Gestalt ベースの方法より旋律ファミリ分類の精度を向上させるか?
  • RQ3選択された時尺度とフィルタパラメータはセグメンテーション境界と分類性能にどのような影響を与えるか?
  • RQ4標準的な距離指標を用いた kNN はウェーブレット由来の特徴でベースライン表現と比較してどのように性能を示すか?

主な発見

  • ウェーブレットベースのセグメンテーションとピッチ信号のウェーブレットフィルタリングは、時尺度とパラメータが最適化された場合、交差検証評価で分類精度を向上させる。
  • この手法はウェーブレット係数最大値を通じて局所境界を強調し、セグメント分類にはkNNを用いる。
  • Gestalt ベースのセグメンテーションと比較して、パラメータを適切に調整した場合、ウェーブレットアプローチは性能が向上する。
  • 民謡の象徴表現と標準的な距離指標を用いた実証的証拠を提供する。
  • 結果は FMA2013 の文脈で、7 ページ、4 図、2 表として報告される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。