Skip to main content
QUICK REVIEW

[논문 리뷰] Developing and Evaluating a Probabilistic LR Parser of Part-of-Speech and Punctuation Labels

Ted Briscoe, John A. Carroll|arXiv (Cornell University)|1995. 09. 20.
Natural Language Processing Techniques참고 문헌 17인용 수 26
한 줄 요약

이 논문은 품사 및 구두점 레이블을 사용하여 강건하고 도메인 독립적인 문법 분석을 수행하는 확률적 LR 파서를 제시한다. 괄호로 감싸진 학습 데이터로부터 추정한 확률치와 통합 기반 문법을 결합함으로써, 구두점이 분석 정확도를 크게 향상시킴을 입증한다. 실험 결과, 입력에 구두점을 포함시킬 경우 측정 가능한 성능 향상이 나타났다.

ABSTRACT

We describe an approach to robust domain-independent syntactic parsing of unrestricted naturally-occurring (English) input. The technique involves parsing sequences of part-of-speech and punctuation labels using a unification-based grammar coupled with a probabilistic LR parser. We describe the coverage of several corpora using this grammar and report the results of a parsing experiment using probabilities derived from bracketed training data. We report the first substantial experiments to assess the contribution of punctuation to deriving an accurate syntactic analysis, by parsing identical texts both with and without naturally-occurring punctuation marks.

연구 동기 및 목표

  • 제한 없는 자연어 입력을 처리할 수 있는 강건하고 도메인 독립적인 문법 분석기 개발
  • 구두점의 기여도를 분석 정확도에 미치는 영향을 비교 분석함으로써 평가 (구두점 포함 및 제외 결과 비교)
  • 품사 및 구두점 시퀀스에 대해 통합 기반 문법과 확률적 LR 분석의 융합 효과 평가
  • 괄호로 감싸진 학습 데이터로부터 유도된 확률치를 사용한 분석 성능 평가

제안 방법

  • 파서는 원시 텍스트가 아닌 품사 및 구두점 레이블의 시퀀스를 대상으로 작동한다.
  • 통합 기반 문법을 사용하여 문법적 제약 조건과 관계를 표현한다.
  • 확률적 LR 분석을 적용하며, 확률치는 괄호로 감싸진 학습 코퍼스로부터 추정한다.
  • 입력에 구두점을 포함하거나 제외한 동일한 텍스트를 분석하여 구두점의 영향을 고립적으로 평가한다.
  • 다양한 코퍼스의 커버리지 결과를 보고하여 강건성과 일반화 능력을 입증한다.

실험 결과

연구 질문

  • RQ1도메인 독립적인 환경에서 구두점을 포함시키면 문법 분석 정확도가 어느 정도 향상되는가?
  • RQ2품사 및 구두점 레이블의 시퀀스를 분석할 때 확률적 LR 파서의 성능은 어떠한가?
  • RQ3품사 태그만으로 분석하는 것과 비교해 구두점의 기여도는 어떠한가?
  • RQ4통합 기반 문법이 확률적 LR 분석과 융합되었을 때 문법 분석에 얼마나 효과적인가?

주요 결과

  • 구두점의 포함으로 인해 측정 가능한 성능 향상이 나타나, 분석 정확도가 뚜렷이 향상됨을 입증하였다.
  • 품사 및 구두점 레이블만으로도 다양한 코퍼스에 걸쳐 강건한 커버리지 성능을 달성하였다.
  • 통합 기반 문법과 확률적 LR 분석의 융합은 전체 어휘 입력 없이도 정확한 문법 분석을 가능하게 하였다.
  • 이 연구는 제어 실험을 통해 구두점의 역할을 실증적으로 평가한 첫 번째 중요한 연구이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.