[论文解读] #greysanatomy vs. #yankees: Demographics and Hashtag Use on Twitter
本研究通过分析推特个人资料图片的人脸特征,推断346,050名纽约用户在12个月内的性别、年龄和种族,随后分析不同人口群体的标签使用情况。研究发现显著的群体特异性标签模式——例如#blacklivesmatter在非裔美国人中极为突出,但在白人群体中则不那么显著——表明整体人群趋势分析往往会掩盖在线行为中的关键人口统计细微差别。
Demographics, in particular, gender, age, and race, are a key predictor of human behavior. Despite the significant effect that demographics plays, most scientific studies using online social media do not consider this factor, mainly due to the lack of such information. In this work, we use state-of-the-art face analysis software to infer gender, age, and race from profile images of 350K Twitter users from New York. For the period from November 1, 2014 to October 31, 2015, we study which hashtags are used by different demographic groups. Though we find considerable overlap for the most popular hashtags, there are also many group-specific hashtags.
研究动机与目标
- 调查不同人口群体(性别、年龄、种族)在推特上使用标签的方式,解决社交媒体研究中缺乏人口统计考量的问题。
- 通过使用最先进的面部分析软件,从个人资料图片推断性别、年龄和种族,以克服社交媒体中人口统计数据稀缺的问题。
- 识别某些标签是否被特定人口群体独特或不成比例地使用,揭示隐藏的行为模式。
- 证明整体人群的标签趋势分析往往掩盖了特定群体的行为特征,尤其是代表性不足群体的行为。
- 通过展示从个人资料图片推断人口统计信息在大规模上既可行又具价值,倡导更加包容的社会媒体研究。
提出的方法
- 通过FollowerWonk的“搜索简介”功能,使用基于地理位置的查询收集了230万名纽约地区的推特用户。
- 筛选出仅保留活跃且长期用户(≥10条推文,注册时间超过3个月,最近3个月内有活动),最终得到767,300名用户。
- 对其中346,050名面部可检测的用户,应用最先进的面部分析软件推断其性别、年龄和种族。
- 收集并分析了这些用户在2014年11月至2015年10月期间的1.56亿条推文。
- 使用卡方检验和Phi统计量识别对特定人口群体具有高度区分性的标签。
- 根据其区分能力(Phi得分)对标签进行排序,并比较联合人口统计类别(如年龄+性别+种族)中的使用情况。
实验结果
研究问题
- RQ1推特上不同人口群体(性别、年龄、种族)的标签使用方式有何差异?
- RQ2最流行的标签在不同人口群体中的重叠程度如何,它们在何处出现分歧?
- RQ3哪些标签被特定人口群体独特或不成比例地使用,如何识别这些标签?
- RQ4标签使用频率是否系统性地随年龄或种族等人口因素而变化?
- RQ5整体人群的标签分析在多大程度上掩盖了特定群体的行为,尤其是代表性不足群体的行为?
主要发现
- 使用频率最高的20个标签在不同人口群体中存在显著重叠,其中#nyc在所有群体中使用最广泛。
- 尽管整体趋势相似,群体特异性标签仍清晰显现:#blacklivesmatter在非裔美国人中排名第四,而在白人群体中仅排第19位,显示出明显的种族差异。
- 基于高Phi得分,#asianamerican和#growingupblack分别是亚裔和非裔美国人用户最具区分性的标签。
- 年龄在45至54岁及以上的用户标签使用率更高(28.9%),高于18岁以下用户(18.8%),表明其使用推特更倾向于信息传播或自我归档。
- 在年长、非裔、女性用户中观察到最高的标签-推文比率(39.5%),表明其存在显著的交叉性参与模式。
- 群体规模与标签使用频率之间无显著统计相关性,表明较小的人口群体仍可表现出独特且有意义的网络行为。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。