Skip to main content
QUICK REVIEW

[论文解读] Abstract Syntax Networks for Code Generation and Semantic Parsing

Maxim Rabinovich, Mitchell Stern|arXiv (Cornell University)|Apr 25, 2017
Natural Language Processing Techniques参考文献 25被引用 38
一句话总结

本文提出抽象语法网络(ASNs),一种模块化编码器-解码器框架,通过动态、语法引导的递归解码生成结构良好且符合语法规则的抽象语法树(AST)。该方法在代码生成任务上取得最先进性能(Hearthstone数据集上BLEU为79.2,精确匹配率为22.7%),并在语义解析基准测试中表现优异,且无需针对任务进行专门的工程设计。

ABSTRACT

Tasks like code generation and semantic parsing require mapping unstructured (or partially structured) inputs to well-formed, executable outputs. We introduce abstract syntax networks, a modeling framework for these problems. The outputs are represented as abstract syntax trees (ASTs) and constructed by a decoder with a dynamically-determined modular structure paralleling the structure of the output tree. On the benchmark Hearthstone dataset for code generation, our model obtains 79.2 BLEU and 22.7% exact match accuracy, compared to previous state-of-the-art values of 67.1 and 6.1%. Furthermore, we perform competitively on the Atis, Jobs, and Geo semantic parsing datasets with no task-specific engineering.

研究动机与目标

  • 解决代码生成与语义解析任务中生成结构良好、可执行输出的挑战。
  • 对具有复杂句法与语义约束(如类型正确性与可执行性)的结构化输出进行建模。
  • 开发一种灵活、模块化的解码框架,以反映抽象语 法树(AST)的递归结构。
  • 在无需针对任务调整网络架构的前提下,提升代码生成与语义解析任务的泛化能力与性能表现。
  • 实现端到端学习结构化输出,同时在多样化数据集上保持强泛化能力。

提出的方法

  • 模型采用序列到序列的编码器-解码器架构,并结合注意力机制对输入序列进行编码。
  • 解码器由多个子模型组成,每个子模型负责根据语法规则生成特定类型的AST节点。
  • 解码过程通过子模型之间的动态、相互递归调用实现,以模拟AST的递归结构。
  • 每个子模型通过自顶向下、分层的方式预测其对应AST节点的子节点与属性,完成生成。
  • 系统采用贪婪解码策略,并利用注意力机制在生成过程中关注相关输入标记。
  • 该架构通过在标准AST上的交叉熵损失函数进行端到端训练。

实验结果

研究问题

  • RQ1模块化、递归的解码器架构是否能有效生成适用于代码与语义解析的结构良好抽象语法树?
  • RQ2解码器中的动态递归机制是否相比标准序列到序列模型更能捕捉AST中的结构依赖关系?
  • RQ3该框架是否能在极少调整的前提下,在多样化结构化预测任务中均实现优异性能?
  • RQ4与先前最先进方法相比,该模型在代码生成任务上的表现如何?
  • RQ5代码中哪些结构与句法模式最难以被模型生成?

主要发现

  • 在Hearthstone代码生成基准上,该模型取得79.2的BLEU分数与22.7%的精确匹配准确率,显著优于此前最先进方法(67.1 BLEU,6.1%精确匹配)。
  • 在Jobs数据集上,该模型达到92.9%的精确匹配准确率,超过此前最先进方法的90.7%。
  • 在ATIS与Geo数据集上,该模型表现具有竞争力,其精确匹配性能与Dong和Lapata(2016)相当或更优。
  • 该模型在涉及复杂控制流、变量作用域与非平凡逻辑的命令式代码上表现最弱,常遗漏关键语句或出现轻微语法错误。
  • 对于结构模式可预测且可复用的简单代码或嵌套函数调用式代码,该模型通常表现良好。
  • 评估指标如BLEU与精确匹配被发现并非功能性等价性的理想代理,凸显了对更优评估方法的需求。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。