Skip to main content
QUICK REVIEW

[論文レビュー] Sentiment Analysis : A Literature Survey

Subhabrata Mukherjee, Pushpak Bhattacharyya|arXiv (Cornell University)|Apr 16, 2013
Sentiment Analysis and Opinion Mining参考文献 73被引用数 46
ひとこと要約

この文献調査は、ナイーブベイズ、SVM、マクシマムエントロピーなどの教師あり手法に加え、認知心理学に基づく主観性および視点検出アプローチを含む、感情分析(SA)技術の包括的な概要を提供する。意見マイニング分野における主な課題、応用分野、研究の方向性を特定し、計算言語学およびNLP分野の研究者にとって基盤的な参考文献を提供する。

ABSTRACT

Our day-to-day life has always been influenced by what people think. Ideas and opinions of others have always affected our own opinions. The explosion of Web 2.0 has led to increased activity in Podcasting, Blogging, Tagging, Contributing to RSS, Social Bookmarking, and Social Networking. As a result there has been an eruption of interest in people to mine these vast resources of data for opinions. Sentiment Analysis or Opinion Mining is the computational treatment of opinions, sentiments and subjectivity of text. In this report, we take a look at the various challenges and applications of Sentiment Analysis. We will discuss in details various approaches to perform a computational treatment of sentiments and opinions. Various supervised or data-driven techniques to SA like Naïve Byes, Maximum Entropy, SVM, and Voted Perceptrons will be discussed and their strengths and drawbacks will be touched upon. We will also see a new dimension of analyzing sentiments by Cognitive Psychology mainly through the work of Janyce Wiebe, where we will see ways to detect subjectivity, perspective in narrative and understanding the discourse structure. We will also study some specific topics in Sentiment Analysis and the contemporary works in those areas.

研究の動機と目的

  • 2013年現在における感情分析分野の最先端を体系的にレビューすること。
  • テキストにおける意見、感情、主観性の計算的取り扱いにおける主な課題を特定・分析すること。
  • ナイーブベイズ、SVM、マクシマムエントロピーなどのさまざまな教師ありおよびデータ駆動型アプローチの長所と短所を評価すること。
  • 特にジェイニス・ウィーブの研究から得られる認知心理学的知見を統合し、主観性およびディス course 構造の検出を向上させること。
  • 現在の研究トレンドをマップし、未だ十分に検討されていない、あるいは新たな発展が見込まれるテーマを特定すること。

提案手法

  • ナイーブベイズ、マクシマムエントロピー、SVM、ボルーテッドパーセプトロンを含む教師あり学習手法に分類して、既存の感情分析手法を調査・分類すること。
  • 特徴工学と分類モデルが意見分類タスクにおいて果たす役割を分析すること。
  • 認知心理学の知見を統合し、物語的テキストにおける主観性、視点、ディスコース構造をモデル化すること。
  • 文献に報告された結果に基づいて、各手法のパフォーマンスと限界を評価すること。
  • 意見検出、主観性分類、感情分類という主要なテーマに沿って調査を整理すること。
  • 異なる応用分野やデータタイプにおける手法を比較するための構造化されたレビュー枠組みを用いること。

実験結果

リサーチクエスチョン

  • RQ1非構造化テキストにおける感情や意見を正確に同定・分類する上で主な課題は何であるか?
  • RQ2SVM やマクシマムエントロピーといった教師あり機械学習手法は、感情分類において性能とスケーラビリティの観点でどのように比較されるか?
  • RQ3認知心理学的モデルは、テキストにおける主観性および視点の検出をどの程度向上させることができるか?
  • RQ4現在の感情分析アプローチが、洗練されたまたは文脈依存的な意見を処理する上で直面する主な制限は何であるか?
  • RQ5Web 2.0技術の最近の発展は、感情分析研究の成長と複雑化にどのように影響したか?

主な発見

  • SVM やマクシマムエントロピーといった教師あり手法は、特徴間の相互作用をより効果的に扱えるため、ナイーブベイズよりも感情分類タスクで一貫して優れた性能を示す。
  • 特にジェイニス・ウィーブの研究から得られる認知心理学的原則の統合は、主観的表現およびディスコースレベルの感情構造の検出を顕著に向上させる。
  • 主観性検出は感情分類の前段階として極めて重要であり、構造的言語的および心理的モデルを用いることで顕著な改善が見られる。
  • 進展は見られても、皮肉、文脈依存的な意見、多言語による感情表現の処理という課題は依然として残っている。
  • 文献からは、機械学習と言語的・心理的知見を統合したハイブリッドアプローチへの傾向が顕著に見られ、精度の向上に寄与している。
  • 本調査では、多言語感情分析に関する研究のギャップが特定され、より強固で文脈に適応したモデルの開発が今後必要であると示唆されている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。