[论文解读] Dynamics of Algorithmic Content Amplification on TikTok
论文使用袜🐙木偶审计与 GPT-3.5,展示 TikTok 的“为你”信息流快速放大与机器人兴趣一致的内容,存在主题差异并存在个性化与多样性的权衡。
Intelligent algorithms increasingly shape the content we encounter and engage with online. TikTok's For You feed exemplifies extreme algorithm-driven curation, tailoring the stream of video content almost exclusively based on users' explicit and implicit interactions with the platform. Despite growing attention, the dynamics of content amplification on TikTok remain largely unquantified. How quickly, and to what extent, does TikTok's algorithm amplify content aligned with users' interests? To address these questions, we conduct a sock-puppet audit, deploying bots with different interests to engage with TikTok's "For You" feed. Our findings reveal that content aligned with the bots' interests undergoes strong amplification, with rapid reinforcement typically occurring within the first 200 videos watched. While amplification is consistently observed across all interests, its intensity varies by interest, indicating the emergence of topic-specific biases. Time series analyses and Markov models uncover distinct phases of recommendation dynamics, including persistent content reinforcement and a gradual decline in content diversity over time. Although TikTok's algorithm preserves some content diversity, we find a strong negative correlation between amplification and exploration: as the amplification of interest-aligned content increases, engagement with unseen hashtags declines. These findings contribute to discussions on socio-algorithmic feedback loops in the digital age and the trade-offs between personalization and content diversity.
研究动机与目标
- 量化 TikTok 算法多快放大与用户兴趣一致的内容。
- 使用时间序列和马尔可夫模型评估推荐增长的动态与阶段。
- 评估放大在不同内容主题上的差异及其对内容多样性与探索的影响。
提出的方法
- 部署具有不同兴趣的袜🐙木偶机器人(游戏 Gaming、美食 Food、Gaming+Food)以与 TikTok 的 For You 信息流互动。
- 使用 GPT-3.5 Turbo 从描述和标签评估视频相关性。
- 记录二值相关信号 S_{α,i}(t) 并通过时间窗平均计算 r_{α,i}(t),通过累积和计算 C_{α,i}(t)。
- 通过变化点检测方法识别放大起点 t_o。
- 在起点后用(隐藏的)马尔可夫模型建模动态以推导转移概率与稳态分布。
- 分析视频受欢迎度(点赞数)与时长,以及标签探索及其与放大的关系。
实验结果
研究问题
- RQ1TikTok 的算法有多快放大与机器人兴趣一致的内容?
- RQ2放大如何随时间和不同兴趣类别变化?
- RQ3起点后的推荐动态是什么,马尔可夫/HMM 能否描述它们?
- RQ4内容放大与接触到多样主题(探索)之间的关系如何?
主要发现
- 对兴趣一致内容的放大在所有条件下都很强,通常在前约200段视频内开始。
- 起点时间 t_o 平均为 65.7 个视频(Gaming)、140(Food)、93.2(Gaming+Food),斜率 m_{α,i} 指示 Gaming 的放大更快。
- 累积计数显示高度放大,Gaming、Food、Gaming+Food 分别有 67.4%、52.3% 和 67.2% 的视频与兴趣一致。
- 简单马尔可夫模型显示跟随兴趣一致内容的概率较高(如 Gaming:67% 非兴趣转为兴趣,68.4% 兴趣转为兴趣)。
- 隐马尔可夫模型揭示不同的动态复杂性;Gaming 通常需要的隐藏状态比 Food 少,Gaming+Food 位于中间。
- 兴趣一致的内容往往不如非一致内容受欢迎(点赞较少)且时长较长。
- 更强的放大与标签探索呈负相关(如 c(T) 与 u(T) 的强负相关)。
- 约三分之一的内容在稳态分布中仍然与兴趣不对齐,表明个性化与多样性之间存在权衡。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。