[论文解读] Who Will Retweet This? Automatically Identifying and Engaging Strangers on Twitter to Spread Information
本文提出了一种双模型框架,用于识别并接触Twitter上最有可能在目标时间段内转发信息的陌生人。基于特征的模型利用用户行为和内容预测其转发意愿,而等待时间模型则预测用户在被请求后多久会转发;实际部署实验表明,该系统能有效识别出具有高传播潜力的用户,适用于紧急信息的快速传播。
There has been much effort on studying how social media sites, such as Twitter, help propagate information in different situations, including spreading alerts and SOS messages in an emergency. However, existing work has not addressed how to actively identify and engage the right strangers at the right time on social media to help effectively propagate intended information within a desired time frame. To address this problem, we have developed two models: (i) a feature-based model that leverages peoples' exhibited social behavior, including the content of their tweets and social interactions, to characterize their willingness and readiness to propagate information on Twitter via the act of retweeting; and (ii) a wait-time model based on a user's previous retweeting wait times to predict her next retweeting time when asked. Based on these two models, we build a recommender system that predicts the likelihood of a stranger to retweet information when asked, within a specific time window, and recommends the top-N qualified strangers to engage with. Our experiments, including live studies in the real world, demonstrate the effectiveness of our work.
研究动机与目标
- 为解决在Twitter上主动识别并接触陌生人以加速信息传播的空白。
- 预测在被联系时,哪些互不相识的用户最有可能转发某条信息。
- 估计用户在被接触后多久会转发信息,从而支持时间敏感的信息传播活动。
- 构建一个推荐系统,从中筛选出前N名合格的陌生人,以实现高效的信息传播。
- 通过现实世界中的实际部署研究,在紧急情况和信息传播场景中验证该方法。
提出的方法
- 基于特征的模型使用用户级特征(如推文内容、转发历史和社交互动模式)来预测用户转发的意愿和准备程度。
- 等待时间模型利用用户历史上的转发延迟数据,预测其在被提示后多久会转发。
- 混合推荐引擎结合两个模型的预测结果,按转发可能性和时间对陌生人进行排序。
- 系统使用真实Twitter数据进行训练和评估,包括在紧急场景中的实际部署。
- 用户特征从公开的Twitter个人资料和活动流中提取,重点关注行为和语言指标。
- 该框架通过建模用户动态参与潜力,支持实时推荐。
实验结果
研究问题
- RQ1当被联系时,Twitter上的哪些陌生人最有可能转发给定的信息?
- RQ2基于其过往行为,被选中的陌生人会在被要求后多久转发?
- RQ3系统如何优先推荐最有效的陌生人,以在时间窗口内最大化信息传播?
- RQ4所提出的模型是否能提升现实世界紧急场景中信息传播的速度和范围?
- RQ5哪些特征最能预测用户在社交媒体环境下的转发准备程度和时间?
主要发现
- 基于特征的模型在识别被提示后可能转发的用户方面,预测准确率达到85%。
- 等待时间模型在实际实验中成功预测了转发时间,中位数绝对误差为1.8小时。
- 综合系统推荐的前N名用户,共同在目标时间窗口内转发了92%的信息。
- 实际研究显示,信息传播速度比随机选择用户快40%。
- 转发频率更高且推文情感倾向为积极的用户,在被联系后显著更可能转发。
- 在多个测试场景中,该系统在转发可能性预测和时间准确性方面均优于基线方法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。