QUICK REVIEW
[논문 리뷰] Deep Composer Classification Using Symbolic Representation.
Hye Yoon Lee, Sunghyeon Kim|arXiv (Cornell University)|2020. 10. 11.
Music and Audio Processing인용 수 5
한 줄 요약
이 논문은 심벌릭 음악 표현을 사용하여 고전 음악 작곡가를 분류하기 위한 딥러닝 접근법을 제안한다. MIDI 파일에서 유도된 온셋 및 테너처 활성화 특징을 기반으로 한 이중 채널 2차원 합성곱 신경망을 사용하여 MAESTRO 데이터셋에서 13개 클래스의 작곡가 분류 작업에서 F1 스코어 0.8333을 달성한다.
ABSTRACT
In this study, we train deep neural networks to classify composer on a symbolic domain. The model takes a two-channel two-dimensional input, i.e., onset and note activations of time-pitch representation, which is converted from MIDI recordings and performs a single-label classification. On the experiments conducted on MAESTRO dataset, we report an F1 value of 0.8333 for the classification of 13~classical composers.
연구 동기 및 목표
- 고전 음악에서의 자동 작곡가 분류를 위한 딥러닝 모델을 개발하기 위해.
- 심벌릭 음악 표현 방식이 작곡가 식별에 얼마나 효과적인지 탐색하기 위해.
- 대규모 실세계 데이터셋(MAESTRO)에서의 모델 성능을 평가하기 위해.
- 2차원 심벌릭 표현을 사용한 작곡가 분류의 기준 성능을 설정하기 위해.
제안 방법
- 모델은 시간-피치 공간 내 온셋 및 노트 활성화 패턴을 나타내는 이중 채널 2차원 입력을 사용한다.
- 입력은 MIDI 녹음 데이터를 심벌릭 표현으로 변환하여 유도된다.
- 딥 컨볼루션 신경망이 단일 레이블 분류를 위해 2차원 표현을 처리한다.
- 모델은 MAESTRO 데이터셋에서 13개 클래스의 작곡가 분류를 위해 엔드 투 엔드로 훈련된다.
실험 결과
연구 질문
- RQ1딥 네트워크는 심벌릭 음악 표현으로부터 작곡가를 정확하게 분류할 수 있는가?
- RQ2이중 채널 시간-피치 표현은 작곡가 고유의 패턴을 얼마나 효과적으로 포착하는가?
- RQ3실세계 데이터셋인 MAESTRO에서 어떤 수준의 성능을 달성할 수 있는가?
- RQ4단일 레이블 설정에서 다양한 고전 음악 작곡가에 대해 모델이 일반화되는가?
주요 결과
- 모델은 13개 클래스의 작곡가 분류 작업에서 F1 스코어 0.8333을 달성한다.
- 이중 채널 2차원 입력은 작곡가 식별을 위한 분류 특징을 효과적으로 포착한다.
- 이 접근법은 음악 이해의 기준으로서의 MAESTRO 데이터셋에서 뛰어난 성능을 보여준다.
- 결과는 심벌릭 표현이 딥러닝 기반의 작곡가 분류에 적합하다는 것을 시사한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.