QUICK REVIEW

[论文解读] Deep Composer Classification Using Symbolic Representation.

Hye Yoon Lee, Sunghyeon Kim|arXiv (Cornell University)|Oct 11, 2020

Music and Audio Processing被引用 5

一句话总结

本文提出了一种基于符号音乐表示的深度学习方法，用于分类古典音乐作曲家。该方法在从MIDI文件提取的击键时间和音高激活特征上，采用双通道二维卷积神经网络，在MAESTRO数据集上实现了13类作曲家分类的F1分数为0.8333。

ABSTRACT

In this study, we train deep neural networks to classify composer on a symbolic domain. The model takes a two-channel two-dimensional input, i.e., onset and note activations of time-pitch representation, which is converted from MIDI recordings and performs a single-label classification. On the experiments conducted on MAESTRO dataset, we report an F1 value of 0.8333 for the classification of 13~classical composers.

研究动机与目标

开发一种用于古典音乐中自动作曲家分类的深度学习模型。
探索符号音乐表示在作曲家识别中的有效性。
在大规模真实世界数据集（MAESTRO）上评估模型性能。
建立基于二维符号表示的作曲家分类基线。

提出的方法

该模型使用双通道二维输入，表示时间-音高空间中的击键和音符激活模式。
输入通过将MIDI录音转换为符号表示获得。
深度卷积神经网络处理二维表示以实现单标签分类。
网络在MAESTRO数据集上端到端训练，用于13类作曲家分类。

实验结果

研究问题

RQ1深度神经网络能否从符号音乐表示中准确分类作曲家？
RQ2双通道时间-音高表示在捕捉作曲家特定模式方面的有效性如何？
RQ3在真实世界数据集（如MAESTRO）上可达到怎样的性能水平？
RQ4该模型在单标签设置下能否在多样化的古典作曲家中实现泛化？

主要发现

该模型在13类作曲家分类任务上实现了0.8333的F1分数。
双通道二维输入有效捕捉了用于作曲家识别的判别特征。
该方法在MAESTRO数据集上表现出色，该数据集是音乐理解的基准。
结果表明，符号表示适用于基于深度学习的作曲家分类。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。