Skip to main content
QUICK REVIEW

[论文解读] Deep Composer Classification Using Symbolic Representation.

Hye Yoon Lee, Sunghyeon Kim|arXiv (Cornell University)|Oct 11, 2020
Music and Audio Processing被引用 5
一句话总结

本文提出了一种基于符号音乐表示的深度学习方法,用于分类古典音乐作曲家。该方法在从MIDI文件提取的击键时间和音高激活特征上,采用双通道二维卷积神经网络,在MAESTRO数据集上实现了13类作曲家分类的F1分数为0.8333。

ABSTRACT

In this study, we train deep neural networks to classify composer on a symbolic domain. The model takes a two-channel two-dimensional input, i.e., onset and note activations of time-pitch representation, which is converted from MIDI recordings and performs a single-label classification. On the experiments conducted on MAESTRO dataset, we report an F1 value of 0.8333 for the classification of 13~classical composers.

研究动机与目标

  • 开发一种用于古典音乐中自动作曲家分类的深度学习模型。
  • 探索符号音乐表示在作曲家识别中的有效性。
  • 在大规模真实世界数据集(MAESTRO)上评估模型性能。
  • 建立基于二维符号表示的作曲家分类基线。

提出的方法

  • 该模型使用双通道二维输入,表示时间-音高空间中的击键和音符激活模式。
  • 输入通过将MIDI录音转换为符号表示获得。
  • 深度卷积神经网络处理二维表示以实现单标签分类。
  • 网络在MAESTRO数据集上端到端训练,用于13类作曲家分类。

实验结果

研究问题

  • RQ1深度神经网络能否从符号音乐表示中准确分类作曲家?
  • RQ2双通道时间-音高表示在捕捉作曲家特定模式方面的有效性如何?
  • RQ3在真实世界数据集(如MAESTRO)上可达到怎样的性能水平?
  • RQ4该模型在单标签设置下能否在多样化的古典作曲家中实现泛化?

主要发现

  • 该模型在13类作曲家分类任务上实现了0.8333的F1分数。
  • 双通道二维输入有效捕捉了用于作曲家识别的判别特征。
  • 该方法在MAESTRO数据集上表现出色,该数据集是音乐理解的基准。
  • 结果表明,符号表示适用于基于深度学习的作曲家分类。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。