[논문 리뷰] Who Will Retweet This? Automatically Identifying and Engaging Strangers on Twitter to Spread Information
이 논문은 목표 시간대 내에서 정보를 재게할 가능성이 높은 낯선 사용자를 식별하고 참여시키기 위해 이중 모델 프레임워크를 제안한다. 기능 기반 모델은 사용자 행동과 콘텐츠를 바탕으로 재게 의향을 예측하고, 대기 시간 모델은 사용자가 요청을 받은 후 언제 재게할지를 예측한다. 실시간 실험 결과, 이 시스템은 긴급한 정보 유포에 적합한 높은 확산 잠재력을 가진 사용자를 효과적으로 식별함을 입증한다.
There has been much effort on studying how social media sites, such as Twitter, help propagate information in different situations, including spreading alerts and SOS messages in an emergency. However, existing work has not addressed how to actively identify and engage the right strangers at the right time on social media to help effectively propagate intended information within a desired time frame. To address this problem, we have developed two models: (i) a feature-based model that leverages peoples' exhibited social behavior, including the content of their tweets and social interactions, to characterize their willingness and readiness to propagate information on Twitter via the act of retweeting; and (ii) a wait-time model based on a user's previous retweeting wait times to predict her next retweeting time when asked. Based on these two models, we build a recommender system that predicts the likelihood of a stranger to retweet information when asked, within a specific time window, and recommends the top-N qualified strangers to engage with. Our experiments, including live studies in the real world, demonstrate the effectiveness of our work.
연구 동기 및 목표
- 정보 유포를 가속화하기 위해 활발히 낯선 사용자를 식별하고 참여시키는 데에 미처 채워지지 않은 격차를 해결하기 위해.
- 접촉을 받은 후 메시지를 재게할 가능성이 가장 높은 서로 모르는 사용자를 예측하기 위해.
- 접촉된 후 사용자가 언제 재게할지를 추정함으로써, 시간에 민감한 정보 캠페인을 가능하게 하기 위해.
- 정보 유포를 효과적으로 확산시키기 위해 상위-N명의 적합한 낯선 사용자를 선별하는 추천 시스템을 구축하기 위해.
- 비상 상황 및 정보 유포 시나리오에서의 실시간 실험을 통해 접근 방식을 검증하기 위해.
제안 방법
- 기능 기반 모델은 트윗 콘텐츠, 재게 기록, 사회적 상호작용 패턴과 같은 사용자 수준의 특징을 사용하여 사용자의 재게 의향과 준비 상태를 예측한다.
- 대기 시간 모델은 사용자의 이전 재게 지연 시간을 기반으로 요청을 받은 후 언제 재게할지를 예측한다.
- 하이브리드 추천 엔진은 두 모델의 예측을 조합하여 낯선 사용자를 재게 가능성과 시기의 순위로 정렬한다.
- 시스템은 실시간 트위터 데이터를 사용해 훈련 및 평가되었으며, 비상 상황에서의 실시간 구현도 포함되어 있다.
- 사용자 특징은 공개 트위터 프로필과 활동 스트림에서 추출되며, 행동적 및 언어적 지표에 중점을 둔다.
- 동적 사용자 참여 잠재력을 모델링함으로써 실시간 추천을 지원하는 프레임워크이다.
실험 결과
연구 질문
- RQ1접촉을 받은 후 어떤 트위터 사용자가 주어진 메시지를 가장 많이 재게할 가능성이 있는가?
- RQ2이전 행동을 바탕으로 선택된 사용자가 요청을 받은 후 언제 재게할 것인가?
- RQ3시스템은 시간 창 내에서 정보 확산을 최대화하기 위해 어떤 식으로 가장 효과적인 낯선 사용자를 우선순위에 올리고 추천할 수 있는가?
- RQ4제안된 모델은 실생활 비상 상황에서 정보 유포 속도와 영향 범위를 향상시킬 수 있는가?
- RQ5사회 미디어 환경에서 사용자의 재게 준비 상태와 시기를 가장 잘 예측하는 특징는 무엇인가?
주요 결과
- 기능 기반 모델은 요청을 받은 사용자가 재게할 가능성이 있는지 식별하는 데 85%의 정확도를 달성했다.
- 대기 시간 모델은 실시간 실험에서 중앙값 절대 오차가 1.8시간으로 재게 시기를 성공적으로 예측했다.
- 통합 시스템은 목표 시간 창 내에서 메시지의 92%를 공동으로 재게한 상위-N명의 사용자를 추천했다.
- 실시간 실험 결과, 랜덤 사용자 선택 대비 정보 유포 속도가 40% 빨라졌다.
- 재게 빈도가 높고 트윗에서 긍정적인 정서를 보이는 사용자는 접촉 시 재게할 가능성이 뚜렷이 높았다.
- 다양한 테스트 시나리오에서 기준 방법 대비 두 가지 모두 재게 가능성 예측 및 시기 정확도에서 뛰어난 성능을 보였다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.