Skip to main content
QUICK REVIEW

[論文レビュー] Frame-Semantic Parsing with Softmax-Margin Segmental RNNs and a Syntactic Scaffold

Swabha Swayamdipta, Sam Thomson|arXiv (Cornell University)|Jun 29, 2017
Natural Language Processing Techniques参考文献 46被引用数 95
ひとこと要約

リコール重視の softmax-margin SegRNN を frame-semantic の論拈識別に導入し、構文を用いずに開始、次に構文特徴または訓練時の構文スキャフォールドを追加して、テスト時に解析を行わずに最先端の結果を達成する。

ABSTRACT

We present a new, efficient frame-semantic parser that labels semantic arguments to FrameNet predicates. Built using an extension to the segmental RNN that emphasizes recall, our basic system achieves competitive performance without any calls to a syntactic parser. We then introduce a method that uses phrase-syntactic annotations from the Penn Treebank during training only, through a multitask objective; no parsing is required at training or test time. This "syntactic scaffold" offers a cheaper alternative to traditional syntactic pipelining, and achieves state-of-the-art performance.

研究の動機と目的

  • 構文なしで SegRNN を用いた frame-semantic argument identification モデルを開発する。
  • 構文特徴(依存関係/句構造)が性能へ与える影響を評価する。
  • Penn Treebank を用いて構文の有用性を模倣する syntactic scaffold を訓練時 multitask 目標として提案・評価する。
  • 構文を用いた場合といない場合の FrameNet 1.5 で state-of-the-art もしくはほぼ同等の結果を示す。
  • 再現性とより広い利用のため open-source 実装(open-sesame)を公開する。

提案手法

  • SegRNN(bidirectional LSTM からの span 表現を用いる Semi-Markov CRF)を用いて、各 frame の argument のラベル付き span をスコア付けする。
  • トークンレベルの biLSTM と候補 span 上の第2 の biLSTM から派生した span 埋め込みで spans を表現する。
  • frame、lexical unit、target context の埋め込みを組み合わせて、feedforward ネットワーク(Eq. 7)を介してセグメントスコアを形成する。
  • Eqs. 8–12 に基づいた softmax-margin 目標で訓練し、リコールを精度より優先させる。
  • (a)依存パーサーまたは(b)句構造パーサ(RNNG)からの特徴を span 表現に追加して、構文を任意に補完する(Table 1–2)。
  • フレームセマンティックモデルと並行して、PTB を用いて span constituents を予測する syntactic scaffold multitask objective を導入する(Eq. 16)。テスト時には解析は不要。

実験結果

リサーチクエスチョン

  • RQ1構文を用いない SegRNN が競争力のある精度で frame-semantic arguments を識別できるか。
  • RQ2依存/句構造といった標準的な構文特徴は、ニューラル SegRNN と組み合わせた場合に性能を向上させるか。
  • RQ3PTB から学習した syntactic scaffold は、訓練時もテスト時も構文解析を必要とせず、frame-semantic parsing を改善できるか。
  • RQ4このタスクにおいて softmax-margin のリコール指向訓練は、単純な対数尤度と比較してどうであったか。
  • RQ5提案手法の相対的な性能は、FrameNet 1.5 の最先端システムと比較してどうか。

主な発見

システムArg. Id., 金標本フレーム: PArg. Id., 金標本フレーム: RArg. Id., 金標本フレーム: F1Frame+Arg Id, 予測フレーム: PFrame+Arg Id, 予測フレーム: RFrame+Arg Id, 予測フレーム: F1
SEMAFOR (Das et al., 2014)65.653.859.1--66.8
SEMAFOR (Kshirsagar et al., 2015)66.060.463.1--67.9
FitzGerald et al., 2015---74.865.569.9
Roth et al., 2017---72.168.370.2
FitzGerald et al., 2015 (ensemble)---75.067.370.9
Open-SESAME64.761.262.968.068.168.0
Open-SESAME + dependency features69.460.564.671.067.869.4
Open-SESAME + phrase-structure features69.161.865.370.468.369.3
Open-SESAME + syntactic scaffolding68.460.764.470.167.969.0
Open-SESAME (ensemble)69.563.666.470.569.469.9
Open-SESAME + dependency features (ensemble)70.265.667.870.770.470.6
Open-SESAME + phrase-structure features (ensemble)71.766.368.971.270.570.9
Open-SESAME + syntactic scaffolding (ensemble)72.065.068.371.569.970.7
  • 基本的な構文なしの SegRNN(Open-SESAME)は、構文的手掛かりなしで SEMAFOR ベースラインを上回る。
  • 構文特徴(句構造または依存)を追加すると性能が向上し、いずれの型からも同等の利得が得られる。
  • syntactic scaffold 訓練は、訓練時・テスト時のいかなる構文パーサも不要で state-of-the-art の性能を達成し、構文を使用するモデルに近い性能を示す。
  • Softmax-margin のリコール指向訓練は、全モデル(図3)で一貫して単純なロスより有利である。
  • 自己アンサンブルは顕著な利得を生み、トップシステムが外部リソースを使用する場合と比較して最良のアンサンブル結果を 0.2% の F1 にまで近づける。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。