QUICK REVIEW

[논문 리뷰] Deep Composer Classification Using Symbolic Representation.

Hye Yoon Lee, Sunghyeon Kim|arXiv (Cornell University)|2020. 10. 11.

Music and Audio Processing인용 수 5

한 줄 요약

이 논문은 심벌릭 음악 표현을 사용하여 고전 음악 작곡가를 분류하기 위한 딥러닝 접근법을 제안한다. MIDI 파일에서 유도된 온셋 및 테너처 활성화 특징을 기반으로 한 이중 채널 2차원 합성곱 신경망을 사용하여 MAESTRO 데이터셋에서 13개 클래스의 작곡가 분류 작업에서 F1 스코어 0.8333을 달성한다.

ABSTRACT

In this study, we train deep neural networks to classify composer on a symbolic domain. The model takes a two-channel two-dimensional input, i.e., onset and note activations of time-pitch representation, which is converted from MIDI recordings and performs a single-label classification. On the experiments conducted on MAESTRO dataset, we report an F1 value of 0.8333 for the classification of 13~classical composers.

연구 동기 및 목표

고전 음악에서의 자동 작곡가 분류를 위한 딥러닝 모델을 개발하기 위해.
심벌릭 음악 표현 방식이 작곡가 식별에 얼마나 효과적인지 탐색하기 위해.
대규모 실세계 데이터셋(MAESTRO)에서의 모델 성능을 평가하기 위해.
2차원 심벌릭 표현을 사용한 작곡가 분류의 기준 성능을 설정하기 위해.

제안 방법

모델은 시간-피치 공간 내 온셋 및 노트 활성화 패턴을 나타내는 이중 채널 2차원 입력을 사용한다.
입력은 MIDI 녹음 데이터를 심벌릭 표현으로 변환하여 유도된다.
딥 컨볼루션 신경망이 단일 레이블 분류를 위해 2차원 표현을 처리한다.
모델은 MAESTRO 데이터셋에서 13개 클래스의 작곡가 분류를 위해 엔드 투 엔드로 훈련된다.

실험 결과

연구 질문

RQ1딥 네트워크는 심벌릭 음악 표현으로부터 작곡가를 정확하게 분류할 수 있는가?
RQ2이중 채널 시간-피치 표현은 작곡가 고유의 패턴을 얼마나 효과적으로 포착하는가?
RQ3실세계 데이터셋인 MAESTRO에서 어떤 수준의 성능을 달성할 수 있는가?
RQ4단일 레이블 설정에서 다양한 고전 음악 작곡가에 대해 모델이 일반화되는가?

주요 결과

모델은 13개 클래스의 작곡가 분류 작업에서 F1 스코어 0.8333을 달성한다.
이중 채널 2차원 입력은 작곡가 식별을 위한 분류 특징을 효과적으로 포착한다.
이 접근법은 음악 이해의 기준으로서의 MAESTRO 데이터셋에서 뛰어난 성능을 보여준다.
결과는 심벌릭 표현이 딥러닝 기반의 작곡가 분류에 적합하다는 것을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.