Skip to main content
QUICK REVIEW

[論文レビュー] RELATIO: Text Semantics Capture Political and Economic Narratives

Elliott Ash, Germain Gauthier|arXiv (Cornell University)|Aug 3, 2021
Computational and Text Analysis Methods被引用数 40
ひとこと要約

本稿では、意味的役割(主体、動詞、目的語)を特定し、エンティティをクラスタリングすることで関係的ダイナミクスをマッピングする、非教師ありNLP手法RELATIOを紹介する。1994年から2015年までの米国議会記録に適用した結果、党派的ナラティブ、極化、および政治的・経済的言説の相互接続性が明らかになった。ナラティブネットワークが感情、イデオロギー、言説の進化をどのように定量化できるかを示している。

ABSTRACT

Social scientists have become increasingly interested in how narratives -- the stories in fiction, politics, and life -- shape beliefs, behavior, and government policies. This paper provides an unsupervised method to quantify latent narrative structures in text documents. Our new software package RELATIO identifies coherent entity groups and maps explicit relations between them in the text. We provide an application to the United States Congressional Record to analyze political and economic narratives in recent decades. Our analysis highlights the dynamics, sentiment, polarization, and interconnectedness of narratives in political discourse.

研究の動機と目的

  • 政治的および経済的テキストにおける潜在的なナラティブ構造を定量化する非教師あり手法の開発。
  • エンティティ間の関係的意味を捉えられない、従来のテキスト・アズ・データ手法の欠陥を是正すること。
  • 自然言語処理を用いて、平文のテキストから解釈可能なナラティブマイニングを可能にすること。
  • ナラティブがどのように形成され、進化し、政治的言説におけるイデオロギー的対立を反映するかをマッピングすること。
  • 研究者が大規模なテキストコーパスにおけるナラティブダイナミクスを分析できるように、オープンソースのツール(RELATIO)を提供すること。

提案手法

  • 意味的役割ラベリング(SRL)を用いて、文から主体、行動(動詞)、目的語を抽出し、方向性のある関係を捉える。
  • 複数の語彙的バリエーション(例:「ロナルド・レーガン」と「元大統領レーガン」)を統一されたエンティティラベルに解決するためのエンティティクラスタリングを適用する。
  • 解決済みのエンティティと関連する行動を結びつけて、ナラティブ文を構築する(例:「レジンスはメディケアを終了する」)。
  • 有向多重グラフを構築してナラティブネットワークを表現し、エンティティをノード、関係をエッジとしてモデル化する。
  • ノードの中心性やグラフ距離といったグラフ指標を用いて、ナラティブ言説構造と相互接続性を分析する。
  • センチメント分析と時系列分析を統合し、9・11やイラク戦争といった重要な出来事周辺でのナラティブの進化を追跡する。

実験結果

リサーチクエスチョン

  • RQ1米国議会における政治的ナラティブは、時間の経過とともにどのように党派的分断を反映しているか?
  • RQ2「メディケア」「レジンス」「税金」などの主要な政治的・経済的エンティティを結ぶ支配的ナラティブ構造は何か?
  • RQ3「神よアメリカを祝福して」などの宗教的・愛国的言語(例:「神よアメリカを祝福して」)を含むナラティブは、国家的危機の際にどのように変化するか?
  • RQ4ナラティブネットワークは、政党間で接続された世界観をどの程度明らかにするか?
  • RQ5平文の立法記録から、ナラティブ構造を体系的に抽出・可視化する方法は何か?

主な発見

  • RELATIOは、生の議会記録から「レジンスはメディケアを終了する」や「メディケアは医療を提供する」のような解釈可能なナラティブ文を効果的に抽出した。
  • 党派的ナラティブは顕著に分岐している:デモクラットは「失業手当」「メディケアへの予算削減」「石油会社の利益」を強調するが、レジンスは「資金を維持する」や「政府による医療保険の管理」を強調する。
  • 「神よアメリカを祝福して」や「神よ兵士たちを祝福して」などの宗教的言及は、9・11やイラク侵攻後に頻度が上昇した。
  • ナラティブネットワークは、主要なエンティティ(例:「メディケア」「レジンス」)がイデオロギー的ネットワークの中心的ノードを形成する、相互接続された言説構造を明らかにした。
  • ノード中心性やグラフ距離といったグラフ指標により、デモクラットとレジンスが政治的・経済的問題をどのように異なる構造でフレームするかが明らかになった。
  • 本手法は、関係的意味を保持するナラティブ分析において、bag-of-words や n-gram モデルに比べて優れた解釈可能性を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。