[논문 리뷰] RELATIO: Text Semantics Capture Political and Economic Narratives
이 논문은 문맥 역할(주어, 동사, 목적어)을 식별하고 실체를 군집화하여 관계적 역학을 맵핑함으로써 텍스트에서 서사적 구조를 추출하는 비지도 학습 NLP 방법인 RELATIO를 소개한다. 1994~2015년 미국 의회 기록에 적용한 결과, 파벌적 서사, 극화 현상, 상호연결된 정치경제적 논의가 드러나며, 서사 네트워크가 감정, 이념, 논의의 진화를 어떻게 정량화할 수 있는지 보여준다.
Social scientists have become increasingly interested in how narratives -- the stories in fiction, politics, and life -- shape beliefs, behavior, and government policies. This paper provides an unsupervised method to quantify latent narrative structures in text documents. Our new software package RELATIO identifies coherent entity groups and maps explicit relations between them in the text. We provide an application to the United States Congressional Record to analyze political and economic narratives in recent decades. Our analysis highlights the dynamics, sentiment, polarization, and interconnectedness of narratives in political discourse.
연구 동기 및 목표
- 정치적 및 경제적 텍스트에서 잠재적 서사적 구조를 정량화하기 위한 비지도 방법을 개발하는 것.
- 엔티티 간의 관계적 의미를 포착하지 못하는 텍스트-기반 데이터 방법의 격차를 보완하는 것.
- 자연어 처리를 통해 일반 텍스트에서 해석 가능한 서사 탐색을 가능하게 하는 것.
- 서사가 어떻게 형성되고 진화하며 정치적 논의의 이념적 갈라짐을 반영하는지 맵핑하는 것.
- 연구자들이 대규모 텍스트 코퍼스에서 서사 역학을 분석할 수 있도록 오픈소스 도구(RELATIO)를 제공하는 것.
제안 방법
- 방향성 있는 관계를 포착하기 위해 문장에서 주어, 행동(동사), 목적어를 추출하기 위해 의미 역할 표기(SRL)를 사용한다.
- 다양한 어휘 변형(예: 'Ronald Reagan'과 '전임 대통령 Reagan')을 하나의 실체 레이블로 통합하기 위해 실체 군집화를 적용한다.
- 해결된 실체와 관련된 행동을 연결하여 서사 문장을 구성한다(예: '공화당이 메디케어를 종료한다.').
- 엔티티를 노드로, 관계를 간선으로 하는 방향성 있는 다중그래프를 구축하여 서사 네트워크를 모델링한다.
- 노드 중심성과 그래프 거리와 같은 그래프 지표를 활용해 서사 논의의 구조적 특성과 상호연결성을 분석한다.
- 감성 분석과 시간적 분석을 통합하여 9·11 및 이라크 전쟁과 같은 주요 사건 주변에서 서사의 진화를 추적한다.
실험 결과
연구 질문
- RQ1미국 의회에서의 정치적 서사는 시간이 지남에 따라 어떤 식으로 파벌적 갈라짐을 반영하는가?
- RQ2'메디케어', '공화당', '세금'과 같은 핵심 정치적 및 경제적 엔티티를 연결하는 주요 서사적 구조는 무엇인가?
- RQ3종교적 또는 애국가식 언어(예: '하나님, 미국을 축복하시옵니다')를 포함하는 서사는 국가적 위기 상황에서 어떻게 변화하는가?
- RQ4서사 네트워크는 정치적 파벌 간에 상호연결된 세계관을 어느 정도 드러내는가?
- RQ5일반 텍스트 기반의 입법 기록에서 서사적 구조를 체계적으로 추출하고 시각화할 수 있는가?
주요 결과
- RELATIO는 원시 의회 텍스트에서 '공화당이 메디케어를 종료한다' 또는 '메디케어가 의료 서비스를 제공한다'와 같은 이해할 수 있는 서사 문장을 성공적으로 추출한다.
- 파벌적 서사가 상당히 다름: 민주당은 '실업수당', '메디케어 예산 삭감', '석유 기업 이윤'을 강조하는 반면, 공화당은 '돈 유지', '정부의 의료 서비스 통제'를 강조한다.
- 9·11 이후 및 이라크 침공 이후 '하나님, 미국을 축복하시옵니다'와 '하나님, 군대를 축복하시옵니다'와 같은 종교적 언급 빈도가 증가했다.
- 서사 네트워크에서는 '메디케어'와 '공화당'과 같은 핵심 엔티티가 보다 광범위한 이념적 네트워크에서 중심 노드를 형성하는 상호연결된 논의 구조를 드러낸다.
- 노드 중심성과 그래프 거리와 같은 그래프 기반 지표는 민주당과 공화당이 정치적 및 경제적 문제를 어떻게 다르게 프레임하는지에 대한 구조적 차이를 드러낸다.
- 관계적 의미를 서사 분석에서 유지함으로써 이 방법은 백오브워즈 및 n-gram 모델보다 뛰어난 해석 가능성을 입증한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.