QUICK REVIEW

[논문 리뷰] MIPT-NSU-UTMN at SemEval-2021 Task 5: Ensembling Learning with Pre-trained Language Models for Toxic Spans Detection

Mikhail Kotyushev, Anna Glazkova|arXiv (Cornell University)|2021. 04. 10.

Hate Speech and Cyberbullying Detection참고 문헌 40인용 수 3

한 줄 요약

이 논문은 소셜 미디어 텍스트에서 독성 스파이크를 탐지하기 위해 이중 단계로 미세조정된 BERT 기반 모델을 사용하는 앙상블 접근법을 제시한다. 이 방법은 Jigsaw 데이터에서 도메인 특화 사전 훈련을 수행한 후 토큰 수준의 분류를 수행하며, 앙상블 전략을 통해 SemEval-2021 테스트 세트에서 F1 스코어를 67.55%로 향상시켜 평균보다 약 10% 높게 성과를 냈다.

ABSTRACT

This paper describes our system for SemEval-2021 Task 5 on Toxic Spans Detection. We developed ensemble models using BERT-based neural architectures and post-processing to combine tokens into spans. We evaluated several pre-trained language models using various ensemble techniques for toxic span identification and achieved sizable improvements over our baseline fine-tuned BERT models. Finally, our system obtained a F1-score of 67.55% on test data.

연구 동기 및 목표

전체 텍스트의 독성 탐지보다 더 세분화된 수준인 소셜 미디어 댓글에서 특정 독성 스파이크를 식별하는 도전 과제를 해결하기 위해.
사전 훈련된 언어 모델을 활용한 전이 학습을 통해 자원이 적은 스파이크 수준의 독성 언어 탐지 성능을 향상시키기 위해.
더 나은 일반화 및 강건성을 확보하기 위해 다단계 미세조정과 앙상블 학습의 효과성을 조사하기 위해.
공동 과제에서 데이터 희소성과 애매한 애너테이션 문제를 해결하기 위해 도메인 적응형 사전 훈련과 후처리 전략을 사용하기 위해.

제안 방법

독성 점수 ≥0.5인 샘플을 양성 샘플로 삼고, 음성 샘플 비율을 3:1로 설정하여 대규모 Jigsaw 데이터셋에서 BERT-base-uncased를 미세조정하여 도메인 일치를 향상시켰다.
스팸 수준의 독성 스파이크를 위한 토큰 수준의 이진 분류를 위해 SemEval-2021 훈련 및 검증 데이터를 기반으로 두 번째 미세조정 단계를 수행했다.
다양한 앙상블 전략을 적용: 하드 보팅(스파이크 교차 및 합집합), 가중 확률을 활용한 소프트 보팅, 검증 데이터 기반 메타-분류기 학습.
모델 훈련 및 추론을 위해 Hugging Face Transformers 라이브러리를 사용하였으며, 토큰 수준의 분류 헤드를 통해 각 토큰의 독성 여부를 예측했다.
토큰 오프셋 기반 규칙 기반 병합을 사용하여 모델 출력을 바탕으로 연속된 독성 토큰을 스파이크로 그룹화하는 후처리를 수행했다.
단일 검증 세트를 활용하여 최적의 모델 조합과 보팅 전략을 선택하기 위해 앙상블 성능를 최적화했다.

실험 결과

연구 질문

RQ1먼저 일반적인 독성 댓글 데이터셋에서, 그 다음에는 목표 스파이크 수준 과제에서 이중 단계로 미세조정하는 것이 독성 스파이크 탐지 성능을 향상시키는가?
RQ2하드 보팅, 소프트 보팅, 또는 메타-분류기 중 어느 앙상블 전략이 스파이크 수준의 독성 탐지에서 가장 높은 F1 스코어를 제공하는가?
RQ3Jigsaw 데이터에서 도메인 적응형 사전 훈련을 통해 모델이 미묘하거나 맥락에 의존하는 독성 스파이크 탐지 능력에 어떤 영향을 미치는가?
RQ4데이터셋 내 애너테이션의 애매함과 풍자적 표현이 모델의 일반화 능력과 성능에 어느 정도의 영향을 미치는가?
RQ5독성 스파이크가 애너테이션되지 않은 비독성 게시물에서 과도하게 예측하는 문제를 앙상블 방법이 어느 정도 완화할 수 있는가?

주요 결과

이중 단계 미세조정 접근법은 베이스라인 BERT 모델보다 성능 향상이著명했으며, 테스트 세트에서 최고 F1 스코어는 67.55%에 도달했다.
두 번째 훈련 단계에서 훈련 및 시험 세트를 통합한 데이터셋을 활용한 5겹 교차 검증에서 평균 F1 스코어는 0.6714를 기록했다.
스파이크 교차 앙상블 전략이 가장 뛰어난 성능을 보였으며, 합집합을 사용한 하드 보팅 및 소프트 보팅 방법보다 뛰어났다.
모든 91개 팀의 평균 F1 스코어 57.81%를 약 10%포인트 뛰어나 91개 팀 중 27위를 기록했다.
독성 스파이크 애너테이션이 없는 게시물에서는 모델이 흔히 풍자적 또는 맥락에 의존하는 독성 표현에서 잘못된 예측(가짜 양성)을 내놓는 경향이 있었다.
일부 테스트 예시는 일관성 없거나 너무 광범위하게 스파이크를 애너테이션한 경우가 있었으며, 이는 성능 제한 요인으로 작용했을 가능성이 있었다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.