Skip to main content
QUICK REVIEW

[論文レビュー] From Once Upon a Time to Happily Ever After: Tracking Emotions in Novels and Fairy Tales

Saif M. Mohammad|arXiv (Cornell University)|Sep 23, 2013
Sentiment Analysis and Opinion Mining参考文献 24被引用数 183
ひとこと要約

本稿は、NRC感情辞書を用いて文学的テキスト内の感情語の密度を定量化および可視化する感情ベースのテキスト分析フレームワークを紹介する。実証的に、童話は小説と比較して、特に喜び、驚き、期待、嫌悪の感情語密度の分布が著しく広がっていることが示され、Google Books や Project Gutenberg のような大規模コーパスにおける感情的検索や比較的文学的分析の新しい形を可能にする。

ABSTRACT

Today we have access to unprecedented amounts of literary texts. However, search still relies heavily on key words. In this paper, we show how sentiment analysis can be used in tandem with effective visualizations to quantify and track emotions in both individual books and across very large collections. We introduce the concept of emotion word density, and using the Brothers Grimm fairy tales as example, we show how collections of text can be organized for better search. Using the Google Books Corpus we show how to determine an entity's emotion associations from co-occurring words. Finally, we compare emotion words in fairy tales and novels, to show that fairy tales have a much wider range of emotion word densities than novels.

研究の動機と目的

  • 大規模な文学的テキストコレクション向けの感情および感情分析システムの開発。
  • デジタイズされた文学における感情ベースの検索を可能にし、例えば高揚感や喜びの高いテキストを検索可能にする。
  • 定量的な感情語密度指標を用いて、童話と小説の間での感情的ダイナミクスを比較する。
  • ジャンルや著者ごとの感情分布の可視化と分析を通じて、社会的・スタイル的洞察を獲得する。
  • Project Gutenberg に感情ベースのインターフェースを構築し、感情的コンテンツを通じた文学的テキストへのアクセスを強化する。

提案手法

  • 研究では、クラウドソーシングで作成された語-感情関連辞書である NRC 感情辞書を用い、テキスト内の語に感情ラベルを割り当てる。
  • 感情語密度は、テキスト1万語あたりの感情ラベル付き語の数として計算され、テキスト間比較が可能になる。
  • ヒストограмムや密度プロットなどの可視化手法を用いて、小説や童話を含むコーパス間での感情分布を比較する。
  • Google Books コーパスを活用し、感情語との共起パターンを通じて、エンティティ固有の感情関連性を分析する。
  • 小説と童話における感情語密度の差の有意性を評価するために、統計的検定(p < 0.001)を適用する。
  • 分析は2つのコーパスに適用された:CEN(292部の小説、1881–1922年)、FTC(453編の童話、19世紀の著者如くグリム、アンデルセン、ポッター)。

実験結果

リサーチクエスチョン

  • RQ1童話と小説における感情語密度の分布および大きさの違いは何か?
  • RQ2感情ベースの可視化は、大規模な文学的コーパスの検索および探索を改善できるか?
  • RQ3歴史的テキストにおいて、女性、人種、ゲイの人々といったエンティティは、特徴的な感情語関連性を示すか?
  • RQ4喜び、恐怖、驚きなどの異なる感情(例:喜び、恐怖、驚き)について、童話と小説における感情語密度はどのように異なるか?
  • RQ5童話と小説における感情語密度の標準偏差に有意な差があるか?

主な発見

  • 童話は小説と比較して、喜び、驚き、期待、嫌悪の感情語密度が顕著に高い(p < 0.001)。
  • 童話は小説と比較して、信頼語の密度が顕著に低い(p < 0.001)。
  • すべての8つの基本感情について、童話の感情語密度の標準偏差は小説よりも著しく大きい(p < 0.001)ため、感情のばらつきがより大きいことが示された。
  • 1万語あたり、小説には平均で1,670語の否定的語、2,602語の肯定的語が含まれるが、童話には1,543語の否定的語、2,808語の肯定的語が含まれる(p < 0.001)。
  • 童話における感情語密度の分布は二峰性ではないが、正規分布に近づき、小説よりも極端な値を多く含むため、より広い感情的範囲を持つことが示された。
  • 可視化結果から、童話は小説よりも非常に高いおよび非常に低い感情語密度を持つテキストがより多いことが確認され、感情的変動の広がりが裏付けられた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。