Skip to main content
QUICK REVIEW

[论文解读] Serf and Turf: Crowdturfing for Fun and Profit

Gang Wang, Christo Wilson|arXiv (Cornell University)|Nov 24, 2011
Spam and Phishing Detection参考文献 21被引用 25
一句话总结

本文通过大规模数据收集和主动活动测试,研究了群控刷量系统——即组织人力工人以牟利为目的操纵在线内容的平台。作者发现,此类系统正在迅速扩张,对在线社区具有极强的影响力,严重威胁社交网络及其他在线平台的完整性。

ABSTRACT

Popular Internet services in recent years have shown that remarkable things can be achieved by harnessing the power of the masses using crowd-sourcing systems. However, crowd-sourcing systems can also pose a real challenge to existing security mechanisms deployed to protect Internet services. Many of these techniques make the assumption that malicious activity is generated automatically by machines, and perform poorly or fail if users can be organized to perform malicious tasks using crowd-sourcing systems. Through measurements, we have found surprising evidence showing that not only do malicious crowd-sourcing systems exist, but they are rapidly growing in both user base and total revenue. In this paper, we describe a significant effort to study and understand these "crowdturfing" systems in today's Internet. We use detailed crawls to extract data about the size and operational structure of these crowdturfing systems. We analyze details of campaigns offered and performed in these sites, and evaluate their end-to-end effectiveness by running active, non-malicious campaigns of our own. Finally, we study and compare the source of workers on crowdturfing sites in different countries. Our results suggest that campaigns on these systems are highly effective at reaching users, and their continuing growth poses a concrete threat to online communities such as social networks, both in the US and elsewhere.

研究动机与目标

  • 调查互联网上群控刷量平台的存在、规模及其运营结构。
  • 评估群控刷量活动在影响在线内容和用户参与度方面的有效性。
  • 分析这些平台在不同国家中工人的地理分布与来源情况。
  • 通过展示其现实世界影响,评估群控刷量对在线社区(尤其是社交网络)构成的威胁。

提出的方法

  • 开展大规模网络爬取,提取群控刷量平台的数据,包括活动类型、定价和工人参与情况。
  • 在这些平台上部署受控的、非恶意的活动,以测量其在生成目标在线活动方面的端到端有效性。
  • 收集并分析活动的元数据,如任务持续时间、支付标准和各地区的工人人口统计信息。
  • 对比不同国家的工人来源,以理解劳动力供应和平台运营中的区域差异。
  • 使用统计分析方法,基于观察到的参与度指标评估活动的成功率和平台的可靠性。
  • 采用混合方法,结合被动数据收集与主动实验,以验证研究发现。

实验结果

研究问题

  • RQ1互联网上活跃的群控刷量平台规模有多大,其运营结构如何?
  • RQ2群控刷量活动在生成目标在线参与度方面有多有效?
  • RQ3这些平台在工人来源方面存在怎样的地理分布模式?
  • RQ4群控刷量系统如何规避传统自动化攻击检测机制?
  • RQ5群控刷量对在线社区和平台在经济与社会层面有何影响?

主要发现

  • 群控刷量平台在用户规模和收入方面均迅速增长,表明操纵在线内容的市场显著且持续扩大。
  • 这些平台上的活动在触达目标受众方面极为有效,主动实验中观察到了可量化的参与度成果。
  • 群控刷量平台的工人来自全球各地,各国在劳动力供应和定价方面存在显著差异,表明存在区域专业化现象。
  • 这些系统在运营上高度复杂,具备结构化的任务管理和支付机制,与合法众包平台极为相似。
  • 这些平台成功绕过了旨在检测自动化机器人活动的传统安全机制,因为其依赖人类劳动力。
  • 本研究证明,基于人力的操纵不仅可行,而且可扩展且有利可图,对在线社区的完整性构成可信威胁。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。