[논문 리뷰] Dynamics of Algorithmic Content Amplification on TikTok
본 논문은 GPT-3.5를 이용한 sock-puppet 감사로 TikTok의 For You 피드가 봇의 관심사와 일치하는 콘텐츠를 빠르게 증폭시키며, 주제별 차이와 개인화와 다양성 간의 균형이 존재함을 보여준다.
Intelligent algorithms increasingly shape the content we encounter and engage with online. TikTok's For You feed exemplifies extreme algorithm-driven curation, tailoring the stream of video content almost exclusively based on users' explicit and implicit interactions with the platform. Despite growing attention, the dynamics of content amplification on TikTok remain largely unquantified. How quickly, and to what extent, does TikTok's algorithm amplify content aligned with users' interests? To address these questions, we conduct a sock-puppet audit, deploying bots with different interests to engage with TikTok's "For You" feed. Our findings reveal that content aligned with the bots' interests undergoes strong amplification, with rapid reinforcement typically occurring within the first 200 videos watched. While amplification is consistently observed across all interests, its intensity varies by interest, indicating the emergence of topic-specific biases. Time series analyses and Markov models uncover distinct phases of recommendation dynamics, including persistent content reinforcement and a gradual decline in content diversity over time. Although TikTok's algorithm preserves some content diversity, we find a strong negative correlation between amplification and exploration: as the amplification of interest-aligned content increases, engagement with unseen hashtags declines. These findings contribute to discussions on socio-algorithmic feedback loops in the digital age and the trade-offs between personalization and content diversity.
연구 동기 및 목표
- TikTok의 알고리즘이 사용자 관심사에 맞는 콘텐츠를 얼마나 빨리 증폭하는지 정량화한다.
- 시계열 및 마코프 모델을 사용하여 추천 성장의 역학과 단계를 평가한다.
- 콘텐츠 주제별로 증폭이 어떻게 달라지는지와 콘텐츠 다양성 및 탐색에의 영향을 평가한다.
제안 방법
- distinct interests를 가진 sock-puppet 봇(Gaming, Food, Gaming+Food)을 사용하여 TikTok의 For You 피드를 상호작용하게 한다.
- Use GPT-3.5 Turbo를 활용하여 설명과 해시태그로부터 영상의 관련성을 평가한다.
- S_{α,i}(t)의 이진 관련 신호를 기록하고 시간 창 평균을 통해 r_{α,i}(t)를, 누적 합을 통해 C_{α,i}(t)를 계산한다.
- 변화점 탐지 방법을 통해 증폭 시작 시점 t_o 를 식별한다.
- (숨겨진) 마코프 모델로 이후 역학을 모델링하여 전이 확률과 정상 상태 분포를 도출한다.
- 해시태그 탐색과 증폭 간의 관계를 고려하여 영상의 인기도(likes) 및 지속시간을 분석한다.
실험 결과
연구 질문
- RQ1TikTok의 알고리즘이 봇의 관심사와 일치하는 콘텐츠를 얼마나 빠르게 증폭하는가?
- RQ2시간에 따라 그리고 서로 다른 관심사 범주 간에 증폭이 어떻게 진화하는가?
- RQ3증폭 이후의 추천 역학은 어떠하며 마코프/ HMM으로 포착 가능한가?
- RQ4콘텐츠 증폭과 다양한 주제에 대한 노출(탐색) 사이의 관계는 무엇인가?
주요 결과
- 관심사와 일치하는 콘텐츠의 증폭은 모든 조건에서 강하게 나타나며 일반적으로 초기 약 200개의 비디오 내에서 시작된다.
- 시점 t_o의 평균은 Gaming 65.7비디오, Food 140비디오, Gaming+Food 93.2비디오이며 경사 m_{α,i}는 Gaming에서 더 빠른 증폭을 나타낸다.
- 누적 카운트는 Gaming, Food, Gaming+Food에 각각 67.4%, 52.3%, 67.2%의 영상이 관심사와 일치하도록 강한 증폭을 보여준다.
- 간단한 마코프 모델은 관심사와 일치하는 콘텐츠를 팔로우하는 확률이 상승함을 보여주며(예: Gaming: 67% 비관심에서 관심으로, 68.4% 관심에서 관심으로)
- 숨겨진 마코프 모델은 다양한 동적 복잡성을 드러내며; Gaming은 일반적으로 Food보다 적은 숨겨진 상태를 필요로 하고 Gaming+Food가 중간이다.
- 관심사와 일치하는 콘텐츠는 일반적으로 덜 인기가 많으며(좋아요 수가 적고) 지속시간이 더 긴 경향이 있다.
- 해시태그 탐색과의 상관관계가 강할수록 증폭이 약화되는 경향이 있으며(예: c(T)와 u(T) 사이에 강한 음의 상관관계)
- 약 3분의 1 정도의 콘텐츠는 정상 분포에서 관심사와 일치하지 않는 상태를 유지하며, 개인화와 다양성의 균형을 시사한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.