Skip to main content
QUICK REVIEW

[论文解读] RELATIO: Text Semantics Capture Political and Economic Narratives

Elliott Ash, Germain Gauthier|arXiv (Cornell University)|Aug 3, 2021
Computational and Text Analysis Methods被引用 40
一句话总结

本文提出RELATIO,一种无监督的NLP方法,通过识别语义角色(施事、动词、受事)并聚类实体以映射关系动态,从文本中提取叙事结构。该方法应用于1994–2015年美国国会记录,揭示了党派叙事、极化现象以及政治-经济话语的相互关联,展示了叙事网络如何量化情感、意识形态与话语演变。

ABSTRACT

Social scientists have become increasingly interested in how narratives -- the stories in fiction, politics, and life -- shape beliefs, behavior, and government policies. This paper provides an unsupervised method to quantify latent narrative structures in text documents. Our new software package RELATIO identifies coherent entity groups and maps explicit relations between them in the text. We provide an application to the United States Congressional Record to analyze political and economic narratives in recent decades. Our analysis highlights the dynamics, sentiment, polarization, and interconnectedness of narratives in political discourse.

研究动机与目标

  • 开发一种无监督方法,以量化政治与经济文本中潜在的叙事结构。
  • 解决现有文本作为数据的方法在捕捉实体间关系语义方面的不足。
  • 通过自然语言处理技术,实现从纯文本中可解释的叙事挖掘。
  • 描绘叙事如何形成、演变,并反映政治话语中的意识形态分歧。
  • 为研究人员提供一个开源工具(RELATIO),用于分析大规模文本语料中的叙事动态。

提出的方法

  • 使用语义角色标注(SRL)从句子中提取施事、动作(动词)和受事,捕捉方向性关系。
  • 应用实体聚类技术,将多种词汇变体(如'罗纳德·里根'与'前总统里根')统一为单一实体标签。
  • 通过将解析后的实体与其关联动作连接,构建叙事陈述(例如:'共和党人终止Medicare')。
  • 构建有向多重图以表示叙事网络,将实体作为节点,关系作为边。
  • 采用图度量方法(如节点中心性与图距离)分析叙事话语结构与互联性。
  • 整合情感分析与时间序列分析,追踪9·11事件与伊拉克战争等关键事件周围叙事的演变。

实验结果

研究问题

  • RQ1美国国会在不同时期的政治叙事如何反映党派分歧?
  • RQ2哪些主导的叙事结构将关键政治与经济实体(如'Medicare'、'共和党人'与'税收')联系在一起?
  • RQ3在国家危机期间,涉及宗教或爱国语言的叙事(如'上帝保佑美国')如何演变?
  • RQ4叙事网络在多大程度上揭示了跨政党之间的相互关联世界观?
  • RQ5如何系统性地从纯文本立法记录中提取并可视化叙事结构?

主要发现

  • RELATIO成功从原始国会议事记录中提取出可解释的叙事陈述,如'共和党人终止Medicare'与'Medicare提供医疗保障'。
  • 党派叙事存在显著分化:民主党人强调'失业救济金'、'对Medicare的预算削减'以及'石油公司利润',而共和党人则强调'保留资金'与'政府对医疗的控制'。
  • 在9·11事件与伊拉克战争之后,'上帝保佑美国'与'上帝保佑士兵'等宗教修辞的使用频率显著上升。
  • 叙事网络揭示了相互关联的话语结构,关键实体如'Medicare'与'共和党人'在更广泛的意识形态网络中形成中心节点。
  • 基于图的度量方法(如节点中心性与图距离)揭示了民主党和共和党在政治与经济议题表述上的结构性差异。
  • 与词袋模型和n-gram模型相比,该方法在叙事分析中通过保留关系语义,展现出更优的可解释性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。