QUICK REVIEW

[論文レビュー] Deep Composer Classification Using Symbolic Representation.

Hye Yoon Lee, Sunghyeon Kim|arXiv (Cornell University)|Oct 11, 2020

Music and Audio Processing被引用数 5

ひとこと要約

本論文は、MIDIファイルから抽出したオンセットおよびピッチ活性化特徴を用いた記号的音楽表現を用いて、クラシック音楽の作曲家を分類する深層学習手法を提案する。2チャネルの2次元畳み込みニューラルネットワークを用い、MAESTROデータセットにおいて13クラスの作曲家分類でF1スコア0.8333を達成した。

ABSTRACT

In this study, we train deep neural networks to classify composer on a symbolic domain. The model takes a two-channel two-dimensional input, i.e., onset and note activations of time-pitch representation, which is converted from MIDI recordings and performs a single-label classification. On the experiments conducted on MAESTRO dataset, we report an F1 value of 0.8333 for the classification of 13~classical composers.

研究の動機と目的

クラシック音楽における自動作曲家分類のための深層学習モデルの開発。
記号的音楽表現の作曲家同定への有効性の検討。
大規模かつ現実世界のデータセット（MAESTRO）におけるモデル性能の評価。
2次元記号的表現を用いた作曲家分類のベースラインの確立。

提案手法

モデルは、時間-ピッチ空間におけるオンセットおよびノート活性化パターンを表す2チャネルの2次元入力を使用する。
入力はMIDI録音を記号的表現に変換することで得られる。
深層畳み込みニューラルネットワークが2次元表現を処理し、単一ラベル分類を実行する。
ネットワークは、13クラスの作曲家分類を対象に、MAESTROデータセット上でエンドツーエンドに訓練される。

実験結果

リサーチクエスチョン

RQ1深層ニューラルネットワークは、記号的音楽表現から作曲家を正確に分類できるか？
RQ22チャネルの時間-ピッチ表現は、作曲家固有のパターンを効果的に捉えられるか？
RQ3MAESTROのような現実世界のデータセットにおいて、どの程度の性能が達成可能か？
RQ4単一ラベル設定において、多様なクラシック作曲家にわたってモデルは一般化するか？

主な発見

13クラスの作曲家分類タスクにおいて、F1スコア0.8333を達成した。
2チャネルの2次元入力は、作曲家同定に向けた特徴を効果的に捉えている。
本アプローチは、音楽理解のベンチマークであるMAESTROデータセットにおいて強く優れた性能を示した。
結果から、記号的表現は深層学習に基づく作曲家分類に適していることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。