Skip to main content
QUICK REVIEW

[论文解读] Sentiment Analysis : A Literature Survey

Subhabrata Mukherjee, Pushpak Bhattacharyya|arXiv (Cornell University)|Apr 16, 2013
Sentiment Analysis and Opinion Mining参考文献 73被引用 46
一句话总结

这篇文献综述全面概述了情感分析(SA)技术,涵盖监督学习方法(如朴素贝叶斯、支持向量机和最大熵)以及基于认知心理学的主观性与视角检测方法。它识别了意见挖掘中的关键挑战、应用场景和研究方向,为计算语言学与自然语言处理领域的研究人员提供了基础参考。

ABSTRACT

Our day-to-day life has always been influenced by what people think. Ideas and opinions of others have always affected our own opinions. The explosion of Web 2.0 has led to increased activity in Podcasting, Blogging, Tagging, Contributing to RSS, Social Bookmarking, and Social Networking. As a result there has been an eruption of interest in people to mine these vast resources of data for opinions. Sentiment Analysis or Opinion Mining is the computational treatment of opinions, sentiments and subjectivity of text. In this report, we take a look at the various challenges and applications of Sentiment Analysis. We will discuss in details various approaches to perform a computational treatment of sentiments and opinions. Various supervised or data-driven techniques to SA like Naïve Byes, Maximum Entropy, SVM, and Voted Perceptrons will be discussed and their strengths and drawbacks will be touched upon. We will also see a new dimension of analyzing sentiments by Cognitive Psychology mainly through the work of Janyce Wiebe, where we will see ways to detect subjectivity, perspective in narrative and understanding the discourse structure. We will also study some specific topics in Sentiment Analysis and the contemporary works in those areas.

研究动机与目标

  • 系统回顾2013年为止情感分析的最新研究进展。
  • 识别并分析文本中意见、情感和主观性计算处理的主要挑战。
  • 评估各种监督学习与数据驱动方法(如朴素贝叶斯、支持向量机和最大熵)的优势与局限性。
  • 探讨将认知心理学见解(特别是Janyce Wiebe的研究)整合到情感分析中,以提升主观性与语篇结构检测的效果。
  • 梳理当前研究趋势,并突出情感分析中尚未充分探索或新兴的研究主题。

提出的方法

  • 将现有情感分析技术分类为监督学习方法,包括朴素贝叶斯、最大熵、支持向量机和投票感知器。
  • 分析特征工程与分类模型在意见分类任务中的作用。
  • 整合认知心理学见解,以建模叙事文本中的主观性、视角与语篇结构。
  • 基于文献中报告的结果,评估每种方法的性能与局限性。
  • 围绕关键主题组织综述:意见检测、主观性分类与情感分类。
  • 采用结构化综述框架,比较不同应用领域与数据类型下的方法论。

实验结果

研究问题

  • RQ1在非结构化文本中,准确识别与分类情感与意见的主要挑战是什么?
  • RQ2支持向量机与最大熵等监督机器学习方法在情感分类中的性能与可扩展性如何比较?
  • RQ3认知心理学模型在多大程度上能提升文本中主观性与视角的检测能力?
  • RQ4现有情感分析方法在处理细微或上下文依赖性意见时存在哪些关键局限性?
  • RQ5Web 2.0技术的最新发展如何影响情感分析研究的增长与复杂性?

主要发现

  • 由于能更好地处理特征交互,支持向量机与最大熵等监督方法在情感分类任务中持续优于朴素贝叶斯。
  • 整合认知心理学原理,特别是Janyce Wiebe的研究成果,显著提升了主观表达与语篇级情感结构的检测能力。
  • 主观性检测仍是情感分类的关键前提,当结合结构化语言学与心理学模型时,其性能有显著提升。
  • 尽管已有进展,处理反语、上下文依赖性意见以及多语言情感表达的挑战依然存在。
  • 文献显示,将机器学习与语言学及心理学见解相结合的混合方法正成为提升准确性的趋势。
  • 综述指出了跨语言情感分析研究的不足,并强调了开发更强大、上下文感知模型的迫切需求。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。