QUICK REVIEW
[论文解读] The Complexity of Recognition of Linguistically Adequate Dependency Grammars
Peter Neuhaus, Norbert Broeker|ArXiv.org|Sep 8, 1997
Natural Language Processing Techniques参考文献 11被引用 37
一句话总结
本文证明了对语言上合理的依存语法的识别是NP完全问题,表明即使这些语法在语言学上合理,其解析仍会导致计算复杂性不可解。该结果通过将顶点覆盖问题归约到依存语法学识别问题来建立,证明了即使在非投射性、无序的依存结构下,由于支配关系与优先关系被独立指定,也会导致NP完全性。
ABSTRACT
Results of computational complexity exist for a wide range of phrase structure-based grammar formalisms, while there is an apparent lack of such results for dependency-based formalisms. We here adapt a result on the complexity of ID/LP-grammars to the dependency framework. Contrary to previous studies on heavily restricted dependency grammars, we prove that recognition (and thus, parsing) of linguistically adequate dependency grammars is NP-complete.
研究动机与目标
- 为解决依存语法形式系统缺乏计算复杂性结果的问题,特别是与短语结构语法相比。
- 研究语言上充分的依存语法——尤其是允许非投射结构的语法——是否能拥有高效的识别算法。
- 挑战一种假设,即生成能力的微小提升(如非投射性)仅导致计算复杂性的微小增加。
- 正式确立现代依存语法学中支配与优先关系的分离导致识别问题的NP完全性。
提出的方法
- 从NP完全的顶点覆盖(VC)问题归约到依存语法识别(DGR)问题。
- 构建一个依存语法 G(V,E,k) 和一个输入字符串 σ(V,E,k),使得 σ ∈ L(G) 当且仅当原始VC实例有解。
- 使用带有不同价类(H, R, U)的标记依存树来编码顶点、边和覆盖约束。
- 将词实例分配到价类槽位:H 用于边的端点,R 用于冗余副本,U 用于根依赖顶点。
- 证明该语法生成输入字符串当且仅当原始图中存在大小 ≤ k 的顶点覆盖。
- 建立VC与DGR之间的多项式时间归约和等价性,从而确认DGR的NP完全性。
实验结果
研究问题
- RQ1对语言上充分的依存语法的识别在计算上是否可行,还是因其支配与优先关系的结构独立性而继承了不可解性?
- RQ2能否对允许不连续依存关系的非投射依存语法在多项式时间内进行解析?
- RQ3现代依存语法生成能力的提升是否对应计算复杂性的显著增加?
- RQ4当前依存语法形式系统中支配与优先关系的分离是否是识别问题NP完全性的原因?
主要发现
- 对语言上充分的依存语法的识别是NP完全问题,通过从顶点覆盖问题的多项式时间归约得到证明。
- 即使对于无序依存树,该NP完全性依然成立,而不仅限于不连续或非投射结构。
- 该结果源于支配与优先关系的独立指定,这是现代依存语法理论中的关键特征。
- 复杂性的增加并非纯粹理论问题——这意味着标准的多项式时间解析技术(如基于图表的方法)无法普遍应用于此类形式系统。
- 该结果适用于能够生成上下文有关语言(如 a^n b^n c^n)的不连续依存语法。
- 研究结果表明,高效解析现代依存语法需要启发式或混合方法,正如ParseTalk等系统中所采用的那样。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。