QUICK REVIEW

[논문 리뷰] Interleaving Syntax and Semantics in an Efficient Bottom-Up Parser

John Dowding, Robert T. Moore|ArXiv.org|1994. 07. 05.

Speech and dialogue systems인용 수 39

한 줄 요약

이 논문은 국소적 왼쪽 문맥 제약 조건을 사용하여 문법적 모호성을 감소시키고, 연기된 종류 제약 조건 적용을 통해 의미적 모호성을 줄임으로써 문법과 의미를 동시에 처리하는 효율적인 하향식 파서를 제시한다. 이 방법은 차트 엣지 수와 분석 시간을 순서 수준으로 감소시켜 언어적 구조에 기반한 보다 나은 가설 선택을 통해 음성 인식기 정확도를 크게 향상시킨다.

ABSTRACT

We describe an efficient bottom-up parser that interleaves syntactic and semantic structure building. Two techniques are presented for reducing search by reducing local ambiguity: Limited left-context constraints are used to reduce local syntactic ambiguity, and deferred sortal-constraint application is used to reduce local semantic ambiguity. We experimentally evaluate these techniques, and show dramatic reductions in both number of chart-edges and total parsing time. The robust processing capabilities of the parser are demonstrated in its use in improving the accuracy of a speech recognizer.

연구 동기 및 목표

동시적으로 문법적 및 의미적 구조를 생성하는 효율적인 하향식 파서를 개발하는 것.
강건한 자연어 처리에서 완전성을 유지하면서 局소적 문법적 및 의미적 모호성을 줄이는 것.
문법 커버리지가 불완전한 실제의 노이지 음성 입력에서 분석 효율성과 정확도를 향상시키는 것.
언어적 구조 분석을 음성 인식에 통합하여 단어 오류율과 문장 오류율을 감소시키는 것.

제안 방법

통합 기반 문법을 기반으로 한 차트 기반 하향식 분석을 사용하며, 중복을 방지하기 위해 엣지를 가장 일반적인 형태로 유지한다.
제한된 왼쪽 문맥 검사로, 이전에 분석된 왼쪽 구성요소에 의해 예측된 경우에만 문맥 의존적 어구(예: 승인되지 않은 간격을 포함한 어구)의 구축을 제한한다.
연기된 종류 제약 조건 적용은 의미적 필터링을 문법 엣지 구축 후로 연기함으로써 의미적 모호성을 줄이고 조기 절단을 방지한다.
동일한 부모 비종단 기호를 공유하는 동치의 구문 분석을 압축하여 엣지 과잉 생성을 최소화한다.
파서는 음성 인식기와 통합되며, 어구 수, 완전성, 규칙 선호도를 기반으로 한 Gemini 점수와 인식 점수를 조합하여 최적의 가설을 선택한다.
문법 완전성, 조각 수, 규칙 선호도의 가중 조합을 사용하여 가설을 순위 매기며, 파rameter는 경험적으로 최적화된다.

실험 결과

연구 질문

RQ1제한된 왼쪽 문맥 제약 조건이 완전성을 유지하면서 하향식 파서에서 문법적 모호성을 효과적으로 줄일 수 있는가?
RQ2연기된 종류 제약 조건 적용이 분석 효율성을 유지하면서 의미적 모호성을 줄일 수 있는가?
RQ3통합된 문법과 의미가 비표준적이거나 오류가 있는 발화의 강건한 분석을 어느 정도 향상시킬 수 있는가?
RQ4언어적 구조 분석의 통합이 음성 인식 정확도 향상에 얼마나 효과적인가?

주요 결과

파서는 차트 엣지 수와 총 분석 시간 양쪽 모두에서 순서 수준의 감소를 달성했다.
기본 하향식 파서의 80% 이상의 엣지가 문법적으로 불완전했으며(예: 승인되지 않은 간격 포함), 제한된 왼쪽 문맥 기법이 이를 성공적으로 제거했다.
통합 시스템은 단어 오류율을 12.0%에서 10.7%(1.3% 향상)로, 문장 오류율을 19.6%에서 17.8%(1.8% 향상)로 감소시켰으며, 둘 다 통계적으로 유의미했다.
22개의 잘못된 최초 가설 중 16개는 조각 수가 적은 것을 선호함으로써 수정되었고, 3개는 완전한 문장을 선호함으로써 수정되었다.
오직 하나의 수정만이 문법 규칙 선호도에 기인했으며, 이는 현재의 규칙 선호도 히ュ리스틱이 거의 도움이 되지 않는다는 것을 시사한다.
오류 하나는 잘못된 참조 전사로 인해 발생했고, 다른 하나는 많은 조각을 포함한 올바른 가설에 과도하게 페널티를 주어 발생했으며, 이는 조각 수 히ュ리스틱의 개선 여지가 있음을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.