QUICK REVIEW

[論文レビュー] Dependency resolution and semantic mining using Tree Adjoining Grammars for Tamil Language

Vijay Menon, Suresh Rajendran|arXiv (Cornell University)|Jan 1, 2015

Natural Language Processing Techniques被引用数 1

ひとこと要約

本稿では、Tree Adjoining Grammars (TAGs) を用いてタミル語の依存関係解消と意味的マイニングのフレームワークを提案する。この研究では、Schabes と Joshi (1988) のアルゴリズムに基づく自社開発の疑似語彙的TAGチャートパーサーを活用し、統計的順位付けを用いずに句構造を導出する。主な貢献は、TAGがタミル語の複雑な合成語的語彙構造と格助詞構造を捉えることができ、完全な導出探索によって意味的推論を可能にすることを示したことである。

ABSTRACT

Tree adjoining grammars (TAGs) provide an ample tool to capture syntax of many Indian languages. Tamil represents a special challenge to computational formalisms as it has extensive agglutinative morphology and a comparatively difficult argument structure. Modelling Tamil syntax and morphology using TAG is an interesting problem which has not been in focus even though TAGs are over 4 decades old, since its inception. Our research with Tamil TAGs have shown us that we can not only represent syntax of the language, but to an extent mine out semantics through dependency resolution of the sentence. But in order to demonstrate this phenomenal property, we need to parse Tamil language sentences using TAGs we have built and through parsing obtain a derivation we could use to resolve dependencies, thus proving the semantic property. We use an in-house developed pseudo lexical TAG chart parser; algorithm given by Schabes and Joshi (1988), for generating derivations of sentences. We do not use any statistics to rank out ambiguous derivations but rather use all of them to understand the mentioned semantic relation with in TAGs for Tamil. We shall also present a brief parser analysis for the completeness of our discussions.

研究の動機と目的

タミル語の合成語的語彙構造と複雑な格助詞構造を形式的文法フレームワークでモデル化する課題に対処すること。
Tree Adjoining Grammars (TAGs) がタミル語の文法構造を効果的に表現でき、意味的推論を支援できるかどうかを検討すること。
タミル語の文を解析し、導出を生成するための疑似語彙的TAGチャートパーサーを開発・適用すること。
TAGによって得られた導出における依存関係解消を通じて、タミル語の意味的関係をマイニングできることを示すこと。
パーサーの完全性分析を実施し、提案手法の堅牢性を検証すること。

提案手法

本研究では、Schabes と Joshi (1988) のアルゴリズムに基づく自社開発の疑似語彙的TAGチャートパーサーを用いて、タミル語の文を解析する。
統計的順位付けを用いずに導出を生成し、すべての曖昧な導出を保持することで、意味的関係の探索を可能にする。
得られた木構造に対して依存関係解消を実施し、文法的および意味的依存関係を特定する。
TAGの本質的な形式的性質に依存して、タミル語の合成語的語彙構造と非配置語順をモデル化する。
すべての導出を分析し、意味的関係を抽出する。ヒューリスティック的または統計的プルーニングを避ける。
パーサーの完全性を評価することで、意味的マイニングに向けた手法の信頼性とカバレッジを確認する。

実験結果

リサーチクエスチョン

RQ1Tree Adjoining Grammars (TAGs) は、合成語的語彙構造や格助詞構造を含む、タミル語の文法的・語彙的複雑性を効果的にモデル化できるか？
RQ2TAGによって得られた導出における依存関係解消は、どの程度タミル語における意味的マイニングを支援できるか？
RQ3導出選択において統計的順位付けを用いないことで、タミル語の文における意味的関係の同定にどのような影響が生じるか？
RQ4自社開発のTAGチャートパーサーは、多様なタミル語文の構造をどの程度処理できるか？
RQ5TAGにおける完全な導出探索は、より単純な形式的体系では得られない意味的関係を明らかにできるか？

主な発見

提案されたTAGベースのアプローチは、合成語的語彙構造や非標準的な語順を含む、タミル語の複雑な文法構造と語彙構造を効果的にモデル化できた。
TAGによって得られた導出における依存関係解消により、意味的関係の抽出が可能となり、タミル語における意味的マイニングの可能性が示された。
統計的順位付けを用いないすべての導出を活用することで、曖昧な文における文法的および意味的代替案の包括的探索が可能になった。
パーサーは意味的推論を支援するのに十分な完全性を達成しており、その有効性が検証された。
本研究では、TAGがタミル語の文法構造を捉えるための実用的かつ妥当な形式的体系であることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。