Skip to main content
QUICK REVIEW

[论文解读] A Computational Approach to Politeness with Application to Social Factors

Cristian Danescu-Niculescu-Mizil, Moritz Sudhof|arXiv (Cornell University)|Jun 25, 2013
Language, Discourse, Communication Strategies参考文献 4被引用 149
一句话总结

本文提出了一套计算框架,利用来自维基百科和Stack Exchange的10,000多条人工标注的在线请求语料,识别网络请求中的礼貌行为。该框架引入了一种领域无关的分类器,结合词汇、句法和情感特征,将布朗与莱文森礼貌理论的核心成分进行计算化操作,实现了接近人类水平的性能,并揭示出:礼貌用户在初始阶段更可能获得地位,但一旦晋升至高地位角色后,其礼貌程度反而下降。

ABSTRACT

We propose a computational framework for identifying linguistic aspects of politeness. Our starting point is a new corpus of requests annotated for politeness, which we use to evaluate aspects of politeness theory and to uncover new interactions between politeness markers and context. These findings guide our construction of a classifier with domain-independent lexical and syntactic features operationalizing key components of politeness theory, such as indirection, deference, impersonalization and modality. Our classifier achieves close to human performance and is effective across domains. We use our framework to study the relationship between politeness and social power, showing that polite Wikipedia editors are more likely to achieve high status through elections, but, once elevated, they become less polite. We see a similar negative correlation between politeness and power on Stack Exchange, where users at the top of the reputation scale are less polite than those at the bottom. Finally, we apply our classifier to a preliminary analysis of politeness variation by gender and community.

研究动机与目标

  • 开发一种计算框架,用于识别在线社区用户请求中的礼貌语言标记。
  • 利用维基百科和Stack Exchange的大型人工标注请求语料,检验礼貌理论的核心观点。
  • 探究在线话语中礼貌与社会权力、地位、性别及社区成员身份之间的关系。
  • 构建一个领域无关的礼貌分类器,使其能泛化应用于多样化的在线社区和语言语境。
  • 通过可扩展的自动化分类方法,探索不同社区和人口群体间礼貌规范的差异。

提出的方法

  • 使用亚马逊Mechanical Turk对来自维基百科和Stack Exchange的逾10,000条在线请求进行标注,构建大规模人工标注的礼貌语料库。
  • 设计一种基于监督学习的分类器,采用领域无关的特征,包括词汇项(如“please”、“sorry”)、句法结构(如间接请求、情态动词)、情感(积极、乐观)以及依存关系。
  • 通过计算特征将布朗与莱文森礼貌理论的关键成分(如间接性、恭敬、去个性化、情态性)进行可操作化处理。
  • 在标注语料上训练并评估分类器,实现在各领域内接近人类水平的性能(接近人类准确率)。
  • 将训练好的分类器应用于大规模真实世界数据集,研究礼貌行为在声誉等级、性别及编程语言社区等社会因素上的差异。
  • 采用基于预测的推理方法探索在人工标注不可行的情境下礼貌趋势,通过人工标注子集验证结果。

实验结果

研究问题

  • RQ1在真实请求中,礼貌的语言标记(如间接性、情态性、恭敬性)如何与句法和语境特征相互作用?
  • RQ2礼貌在多大程度上能预测维基百科和Stack Exchange等在线社区中的社会地位获取?
  • RQ3随着用户在社区中社会权力或声誉的提升,其请求中的礼貌程度是否发生变化?
  • RQ4不同在线社区(尤其是Stack Exchange上的编程语言子社区)中,礼貌规范有何差异?
  • RQ5在线话语中性别与礼貌的关系如何?与以往研究结果相比有何异同?

主要发现

  • 维基百科中更礼貌的编辑者在社区选举中显著更有可能获得高地位角色,表明礼貌是获取地位的战略性资源。
  • 一旦被选为高地位角色,维基百科编辑者的礼貌程度明显下降,支持了‘权力削弱礼貌需求’的预测。
  • 在Stack Exchange上,声誉排名前四分之一的用户比后四分之一的用户明显更不礼貌,证实了礼貌与权力之间存在负相关关系。
  • Stack Exchange上不同编程语言社区的礼貌水平存在显著差异,Ruby和JavaScript社区的礼貌得分分别为0.59和0.53,高于Python社区的0.47。
  • 女性维基百科编辑者始终比男性同行更礼貌,与以往关于在线交流中性别与礼貌的研究结果一致。
  • 来自美国中西部的用户在全美人口普查定义的区域中礼貌程度最高,表明礼貌规范存在区域差异。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。