Skip to main content
QUICK REVIEW

[论文解读] Mark My Words! Linguistic Style Accommodation in Social Media

Cristian Danescu-Niculescu-Mizil, Michael Gamon|arXiv (Cornell University)|May 3, 2011
Authorship Attribution and Profiling参考文献 38被引用 193
一句话总结

本文利用一种新颖的概率框架,研究大规模真实世界 Twitter 对话中的语言风格适应现象,以区分风格适应与同质性及话题效应。研究证实,尽管 Twitter 平台存在非实时、字符数限制和社交背景多样的特点,用户仍会无意识地在风格特征(如功能词和句法模式)上趋于一致,表明风格适应在非实时、字符受限且社交背景多样的情境中依然具有强韧性。

ABSTRACT

The psycholinguistic theory of communication accommodation accounts for the general observation that participants in conversations tend to converge to one another's communicative behavior: they coordinate in a variety of dimensions including choice of words, syntax, utterance length, pitch and gestures. In its almost forty years of existence, this theory has been empirically supported exclusively through small-scale or controlled laboratory studies. Here we address this phenomenon in the context of Twitter conversations. Undoubtedly, this setting is unlike any other in which accommodation was observed and, thus, challenging to the theory. Its novelty comes not only from its size, but also from the non real-time nature of conversations, from the 140 character length restriction, from the wide variety of social relation types, and from a design that was initially not geared towards conversation at all. Given such constraints, it is not clear a priori whether accommodation is robust enough to occur given the constraints of this new environment. To investigate this, we develop a probabilistic framework that can model accommodation and measure its effects. We apply it to a large Twitter conversational dataset specifically developed for this task. This is the first time the hypothesis of linguistic style accommodation has been examined (and verified) in a large scale, real world setting. Furthermore, when investigating concepts such as stylistic influence and symmetry of accommodation, we discover a complexity of the phenomenon which was never observed before. We also explore the potential relation between stylistic influence and network features commonly associated with social status.

研究动机与目标

  • 研究语言风格适应是否在大规模真实世界社交媒体对话中出现,特别是在 Twitter 上。
  • 开发一种概率框架,能够测量语言风格适应,同时将其与同质性及话题相关趋同区分开来。
  • 探讨二元 Twitter 互动中风格适应的对称性与影响力动态。
  • 探究风格影响与社交网络特征(如地位和关系类型)之间的关系。
  • 验证沟通适应理论在与以往受控实验室环境截然不同的环境中的稳健性。

提出的方法

  • 提出一种概率框架,通过估计对话双方之间风格趋同的可能性来建模语言风格适应。
  • 使用包含近一年完整对话历史的大规模 Twitter 数据集来训练和评估模型。
  • 采用改进的基于 LDA 的方法识别对话结构和言语行为,从而将风格效应与内容和话题分离开来。
  • 使用功能词和句法模式来建模风格特征,这些特征已知具有无意识性和内容无关性。
  • 实施一种统计分解方法,以分离风格适应效应与同质性(因共同兴趣导致的相似性)及话题相关趋同。
  • 使用条件概率模型来估计用户之间风格影响的程度,从而实现对非对称适应的测量。

实验结果

研究问题

  • RQ1尽管平台具有非实时、字符数限制和非对话性设计,语言风格适应是否仍会在大规模真实世界 Twitter 对话中出现?
  • RQ2在社交媒体互动中,风格趋同在多大程度上可以与同质性和话题相关相似性区分开来?
  • RQ3风格适应是否对称?还是某一用户更倾向于采纳另一用户的风格?
  • RQ4风格影响与社交网络特征(如社交地位、粉丝数或关系持续时间)之间有何关联?
  • RQ5观察到的适应模式能否用于检测伪造或被操纵的对话记录?

主要发现

  • 在 Twitter 对话中,语言风格适应现象被稳健地观察到,证实用户会无意识地在功能词和句法模式等风格特征上趋于一致。
  • 所提出的概率框架成功地将适应效应与同质性及话题相关趋同区分开来,验证了其纯净性和表达力。
  • 风格影响通常具有非对称性,其中一方(通常是更活跃或地位更高的个体)对另一方的风格具有更强的影响。
  • 适应并非仅限于初始互动;它在长期关系中持续存在,表明这是一种持续的社交机制。
  • 风格趋同程度与社交网络特征(如粉丝数和关系持续时间)相关,表明地位与影响力之间存在关联。
  • 研究结果支持沟通适应理论在自然主义、大规模环境中的普适性,表明这是一种根深蒂固的人类行为。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。