Skip to main content
QUICK REVIEW

[论文解读] Linguistic Analysis of Toxic Behavior in an Online Video Game

Haewoon Kwak, Jeremy Blackburn|arXiv (Cornell University)|Oct 20, 2014
Digital Games and Media参考文献 7被引用 28
一句话总结

本研究分析了来自590,311个《英雄联盟》举报案件的游戏中聊天记录,以识别有毒行为的语言标志。通过分析消息频率和用词的时间序列,研究发现有毒玩家表现出双峰式聊天模式,在比赛进行到40%-60%区间时,其语言从合作性转向攻击性,并停止使用积极、策略性和道歉性语言——为早期检测行为向有毒化的转变提供了语言足迹。

ABSTRACT

In this paper we explore the linguistic components of toxic behavior by using crowdsourced data from over 590 thousand cases of accused toxic players in a popular match-based competition game, League of Legends. We perform a series of linguistic analyses to gain a deeper understanding of the role communication plays in the expression of toxic behavior. We characterize linguistic behavior of toxic players and compare it with that of typical players in an online competition game. We also find empirical support describing how a player transitions from typical to toxic behavior. Our findings can be helpful to automatically detect and warn players who may become toxic and thus insulate potential victims from toxic playing in advance.

研究动机与目标

  • 理解在线多人游戏中有毒行为的语言构成,特别是《英雄联盟》等竞技团队对战环境中的表现。
  • 识别比赛过程中有毒玩家与普通玩家之间沟通模式的差异。
  • 仅通过游戏内聊天记录,检测从正常行为到有毒行为的时间转换点。
  • 为早期预警系统提供实证依据,以便在玩家行为升级为有毒行为前及时识别。
  • 通过识别具有区分性的语言特征,区分有毒行为与可接受的竞技性言语攻击。

提出的方法

  • 从北美地区收集了590,311个《英雄联盟》举报案件,涵盖210万名玩家参与的210万场对局中的聊天记录,涉及有毒与普通玩家。
  • 提取并对比了来自有毒玩家的2400万条消息与来自普通玩家的3300万条消息,仅聚焦于游戏内聊天内容。
  • 分析时间序列上的聊天量模式,发现双峰分布,峰值出现在比赛开始和结束阶段。
  • 识别有毒与普通玩家使用的具有区分性的单字词和双字词,作为行为特征标识。
  • 计算常见单字词的最后一次使用时间的归一化时间,以检测行为分歧点。
  • 通过用词时间序列分析,识别语言行为的阶段转换,特别是积极语言与策略性语言的中止。

实验结果

研究问题

  • RQ1在比赛过程中,有毒玩家与普通玩家的游戏内沟通量和时间分布有何不同?
  • RQ2哪些语言特征(如特定词汇或短语)可将有毒玩家与普通玩家区分开来?
  • RQ3玩家的沟通行为在比赛的哪个时间点从正常转变为有毒?
  • RQ4随着比赛推进,哪些类型的词汇(如道歉、赞美、策略术语)在有毒玩家中使用频率降低?
  • RQ5是否可仅通过聊天记录中的语言模式检测到有毒行为的转变,而无需依赖游戏内行为数据?

主要发现

  • 有毒玩家表现出双峰式聊天量模式,峰值出现在比赛开始和结束阶段,而普通玩家在前期更持续地聊天,用于团队协调。
  • 尽管有毒玩家发送的消息少38%,但其使用的独特词符(tokens)却少了13%,表明其词汇更重复且更有限。
  • 有毒玩家发送的消息平均长度为3.139个词,高于普通玩家的2.732个词,暗示其沟通更具攻击性或情绪化。
  • 有毒玩家在比赛进行到某一阶段后,停止使用积极语言,如'gj'(干得好)、'sorry'(抱歉)和'brb'(马上回来),表明团队凝聚力出现破裂。
  • 策略性术语如'ward'(守卫)、'blue'(蓝buff)、'ult'(大招)和'come'(来支援)在比赛早期被有毒玩家使用,但中段后停止,表明合作意图的丧失。
  • 常见单字词最后一次使用的时序差异显示,普通玩家维持合作性与积极语言的时间显著长于有毒玩家,为检测行为转变提供了可识别的足迹。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。