Skip to main content
QUICK REVIEW

[논문 리뷰] Assessing BERT's Syntactic Abilities

Yoav Goldberg|arXiv (Cornell University)|2019. 01. 16.
Natural Language Processing Techniques참고 문헌 6인용 수 295
한 줄 요약

논문은 BERT의 양방향, 주의 기반 아키텍처가 영어 구문 의존성을 포착하는지, 과거 구문 테스트를 마스킹된 양방향 설정으로 적용하여 평가합니다; 결과는 구문 민감도가 강하고, 베이스가 종종 대형보다 우수한 성능을 보입니다.

ABSTRACT

I assess the extent to which the recently introduced BERT model captures English syntactic phenomena, using (1) naturally-occurring subject-verb agreement stimuli; (2) "coloreless green ideas" subject-verb agreement stimuli, in which content words in natural sentences are randomly replaced with words sharing the same part-of-speech and inflection; and (3) manually crafted stimuli for subject-verb agreement and reflexive anaphora phenomena. The BERT model performs remarkably well on all cases.

연구 동기 및 목표

  • 영어에서 BERT가 구문 의존성을 포착하는지에 대한 조사를 촉진한다.
  • 기존의 구문 평가 자극을 BERT의 양방향 마스킹 프레임워크에 맞게 적응한다.
  • 표준 구문 현상에서 BERT Base와 BERT Large를 비교한다.
  • 구문 학습에서 순수한 주의 기반 모델의 한계와 시사점을 논의한다.

제안 방법

  • Linzen 등(2016), Gulordava 등(2018), Marvin & Linzen(2018)의 자극을 BERT의 양방향 설정에 맞게 적응한다.
  • 타깃 동사를 마스킹하고 예측 로짓을 올바른 굴절과 잘못된 굴절 간의 차이를 점수화한다.
  • 예측을 평가하기 위해 동사를 제외한 전체 문장을 사용하고, 원형과 대체 형태를 비교한다.
  • PyTorch 구현 및 사전 학습 가중치를 사용하여 BERT-Base와 BERT-Large를 실험한다.
  • 초점 동사나 그 굴절이 어휘 밖이거나 토큰화에 부적합한 자극은 폐기하고, 적절한 경우 NPI와 연결동사(copular) 사례를 생략한다.

실험 결과

연구 질문

  • RQ1양방향 마스킹을 가진 BERT가 영어의 주어-동사 일치 및 관련 구문 현상을 포착할 수 있는가?
  • RQ2구문에 민감한 작업에서 BERT-Base와 BERT-Large의 차이는 무엇인가?
  • RQ3데이터셋 선택, 사전 학습 코퍼스, 평가 프로토콜이 관찰된 구문 성능에 미치는 영향은 무엇인가?
  • RQ4자연 발생 문장을 넘어서 제어된 자극이나 nonce 자극으로 일반화되는가?

주요 결과

끌어당자BERT BaseBERT Large# 문장수
10.970.9724031
20.970.974414
30.960.96946
40.970.96254
  • BERT는 구문 테스트 케이스에서 높은 정확도를 달성하며, 종종 이전의 LSTM 기반 모델보다 높다.
  • 많은 조건에서 BERT-Base가 BERT-Large보다 우수하다.
  • 양방향성, 서로 다른 학습 데이터 및 자극의 폐지로 인해 prior와 직접 비교할 수 없다.
  • 적절한 평가 설정이 주어지면 BERT와 같은 순수한 주의 기반 모델이 위계 의존 구문을 LSTM 모델과 비슷하거나 더 잘 포착할 수 있음을 시사한다.
  • 일부 예외가 존재하지만(Table 3의 문장 보어 및 짧은 VP 합성에서), 전반적으로 BERT의 강한 구문 일반화를 선호하는 경향이다.
  • 본 연구는 더 큰 모델이 보편적으로 더 나은 구문 성능을 보이지 않는다는 점을 강조한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.