Skip to main content
QUICK REVIEW

[論文レビュー] The placement of the head that maximizes predictability. An information theoretic approach

Ramon Ferrer‐i‐Cancho|arXiv (Cornell University)|May 28, 2017
Language and cultural evolution参考文献 65被引用数 26
ひとこと要約

本稿では、人間の言語における語順が、文法的依存関係における中心語名詞の予測可能性を最適化するために設計されていると提唱している。情報理論を用いてこの原則を従来の依存距離最小化と併せてモデル化し、中心語を文の最後に置くことで予測可能性が最大になると示している。これにより、依存距離最小化とのトレードオフが生じ、SVO、VSOなど6つの可能な語順の分布と進化を、二重最適化フレームワークによって説明している。

ABSTRACT

The minimization of the length of syntactic dependencies is a well-established principle of word order and the basis of a mathematical theory of word order. Here we complete that theory from the perspective of information theory, adding a competing word order principle: the maximization of predictability of a target element. These two principles are in conflict: to maximize the predictability of the head, the head should appear last, which maximizes the costs with respect to dependency length minimization. The implications of such a broad theoretical framework to understand the optimality, diversity and evolution of the six possible orderings of subject, object and verb are reviewed.

研究の動機と目的

  • 予測可能性最大化を語順の数学的理論に統合し、依存距離最小化と補完する。
  • 依存距離最小化と中心語の予測可能性最大化の間の矛盾を解消する。
  • SVO、VOS、OVSなど6つの可能な語順の分布と進化的安定性を、二重最適性フレームワークを用いて説明する。
  • 情報理論的原則を通じて、言語の多様性とタイプロジー的パターンを理解する理論的基盤を提供する。

提案手法

  • 情報理論を用いて、依存距離最小化と予測可能性最大化のトレードオフとして語順をモデル化する。
  • シャノンのエントロピーを用いて、節内の位置に応じた中心語の予測可能性を定量化する。
  • 依存構造の確率的モデルに基づき、予測可能性を最大化する最適な中心語位置を導出する。
  • 依存距離と予測可能性の二重制約下で、6つの可能な語順(SVO、VSO、OVSなど)を比較する。
  • 各語順構成の情報理論的コストを計算するための形式的フレームワークを用いる。
  • 予測可能性の向上と依存距離のペナルティの両者をバランスさせることで、各語順の理論的適性を評価する。

実験結果

リサーチクエスチョン

  • RQ1中心語を節内の異なる位置に置くと、文の文法的依存関係の予測可能性にどのように影響するか?
  • RQ2情報理論的制約下で、予測可能性を最大化する最適な中心語位置は何か?
  • RQ3依存距離最小化と予測可能性最大化という二つの競合する原則は、語順の形成にどのように作用するか?
  • RQ4なぜ特定の語順(例:SVO、VSO)が他の語順よりも言語の間でより一般的に見られるのか?
  • RQ5二重最適性フレームワーク下で、6つの可能な語順を理論的最適性の観点からどのように順位付けできるか?

主な発見

  • 予測可能性を最大にする中心語の位置は、文の最終位置であり、文脈的情報の蓄積が最大になるからである。
  • 中心語を最後に置くことは、早期配置を好む依存距離最小化と矛盾を生じる。
  • SVOおよびVSO語順は、予測可能性と依存距離の両者を最適に妥協する形で出現し、自然言語における頻度の高さを説明できる。
  • モデルは、OVSおよびVOS語順が低い予測可能性と高い依存距離を示すため、より最適性に欠けると予測している。
  • 理論的枠組みは、二つの競合する原則をバランスさせることで、語順の観察されたタイプロジー的分布を説明できる。
  • 結果は、予測可能性最大化が、しばしば無視されがちな文法的語順進化の根本的要因であるという仮説を支持している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。