Skip to main content
QUICK REVIEW

[论文解读] Examining the Presence of Gender Bias in Customer Reviews Using Word Embedding

Arul Mishra, Himanshu Mishra|arXiv (Cornell University)|Jan 1, 2019
Consumer Market Behavior and Pricing参考文献 36被引用 5
一句话总结

本研究对1100万条亚马逊和Yelp用户评论使用GloVe词嵌入技术,检测客户评论中刻板化的性别偏见,发现女性更常与负面特质(如善变、居家)相关联,而男性则与正面特质(如忠诚、理智)相关联。这种偏见影响了消费者选择,尤其在负面评价下,女性消费者更少选择具有正面属性的产品,揭示了算法在产品推荐中强化性别刻板印象的现象。

ABSTRACT

Humans have entered the age of algorithms. Each minute, algorithms shape countless preferences from suggesting a product to a potential life partner. In the marketplace algorithms are trained to learn consumer preferences from customer reviews because user-generated reviews are considered the voice of customers and a valuable source of information to firms. Insights mined from reviews play an indispensable role in several business activities ranging from product recommendation, targeted advertising, promotions, segmentation etc. In this research, we question whether reviews might hold stereotypic gender bias that algorithms learn and propagate Utilizing data from millions of observations and a word embedding approach, GloVe, we show that algorithms designed to learn from human language output also learn gender bias. We also examine why such biases occur: whether the bias is caused because of a negative bias against females or a positive bias for males. We examine the impact of gender bias in reviews on choice and conclude with policy implications for female consumers, especially when they are unaware of the bias, and the ethical implications for firms.

研究动机与目标

  • 调查客户评论是否包含刻板化性别偏见,而算法可能学习并传播此类偏见。
  • 确定该偏见是源于对女性的负面刻板印象,还是对男性的正面刻板印象。
  • 评估性别偏见评论对消费者决策的影响,特别是在产品推荐系统中的影响。
  • 强调当偏见评论影响算法决策时,企业与女性消费者所面临的伦理与政策影响。

提出的方法

  • 将GloVe(全局向量)词嵌入应用于分析来自亚马逊和Yelp的1100万条客户评论中的语义关联。
  • 在大规模文本上训练词向量,以捕捉词语与性别化特质之间的语义关系。
  • 使用词相似度与类比技术测量评论语言中隐含的性别偏见(例如,'woman'与'fickle'的关系 vs. 'man'与'sensible'的关系)。
  • 开展受控实验,测试性别化推荐对消费者选择的影响,比较正面与负面推荐条件下的差异。
  • 分析搜索查询结果,考察性别化术语(如'sensible shopper'与'impulsive shopper')是否触发不同的图像联想。
  • 使用对数似然比与z检验,对不同条件下选择行为的差异进行统计评估。

实验结果

研究问题

  • RQ1客户评论是否包含算法可学习并传播的隐性性别偏见?
  • RQ2所观察到的性别偏见是由对女性的负面关联,还是对男性的正面关联所驱动?
  • RQ3评论中的性别偏见是否影响消费者选择,特别是在产品推荐系统中?
  • RQ4推荐的正负性(正面 vs. 负面)如何影响性别偏见对消费者决策的影响?

主要发现

  • 在客户评论中,女性显著与负面特质如'fickle'(善变)、'impulsive'(冲动)、'homebound'(居家)相关联,而男性则更常与正面特质如'loyal'(忠诚)、'sensible'(理智)、'industrious'(勤奋)相关联。
  • 在产品推荐实验中,负面推荐降低了女性消费者选择正面属性产品的可能性,而正面推荐对她们的选择无显著影响。
  • 对于男性消费者,正面推荐使其选择正面属性产品的比例提升至63.84%,高于对照组的54.1%,但负面推荐无显著影响。
  • 男性在正面推荐条件下的对数似然比为-0.42(p < 0.04),表明正面推荐对男性行为具有统计显著影响。
  • 使用负面性别化术语的搜索查询(如'impulsive shopper')触发的图像中,女性关联图像更多,而正面术语(如'sensible shopper')则较少,表明算法放大了性别刻板印象。
  • 有偏见的评论可能导致产品推荐中的歧视性结果,尤其会引导女性远离职业导向或高价值产品,对企业和消费者构成伦理关切。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。