QUICK REVIEW
[论文解读] Deep Composer Classification Using Symbolic Representation.
Hye Yoon Lee, Sunghyeon Kim|arXiv (Cornell University)|Oct 11, 2020
Music and Audio Processing被引用 5
一句话总结
本文提出了一种基于符号音乐表示的深度学习方法,用于分类古典音乐作曲家。该方法在从MIDI文件提取的击键时间和音高激活特征上,采用双通道二维卷积神经网络,在MAESTRO数据集上实现了13类作曲家分类的F1分数为0.8333。
ABSTRACT
In this study, we train deep neural networks to classify composer on a symbolic domain. The model takes a two-channel two-dimensional input, i.e., onset and note activations of time-pitch representation, which is converted from MIDI recordings and performs a single-label classification. On the experiments conducted on MAESTRO dataset, we report an F1 value of 0.8333 for the classification of 13~classical composers.
研究动机与目标
- 开发一种用于古典音乐中自动作曲家分类的深度学习模型。
- 探索符号音乐表示在作曲家识别中的有效性。
- 在大规模真实世界数据集(MAESTRO)上评估模型性能。
- 建立基于二维符号表示的作曲家分类基线。
提出的方法
- 该模型使用双通道二维输入,表示时间-音高空间中的击键和音符激活模式。
- 输入通过将MIDI录音转换为符号表示获得。
- 深度卷积神经网络处理二维表示以实现单标签分类。
- 网络在MAESTRO数据集上端到端训练,用于13类作曲家分类。
实验结果
研究问题
- RQ1深度神经网络能否从符号音乐表示中准确分类作曲家?
- RQ2双通道时间-音高表示在捕捉作曲家特定模式方面的有效性如何?
- RQ3在真实世界数据集(如MAESTRO)上可达到怎样的性能水平?
- RQ4该模型在单标签设置下能否在多样化的古典作曲家中实现泛化?
主要发现
- 该模型在13类作曲家分类任务上实现了0.8333的F1分数。
- 双通道二维输入有效捕捉了用于作曲家识别的判别特征。
- 该方法在MAESTRO数据集上表现出色,该数据集是音乐理解的基准。
- 结果表明,符号表示适用于基于深度学习的作曲家分类。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。