[论文解读] "Birds of a Feather": Does User Homophily Impact Information Diffusion in Social Media?
本文提出一种动态贝叶斯网络框架,通过建模用户在地理位置、活动行为和信息角色等属性上的同质性,以预测Twitter上的信息传播。结果表明,与非同质性模型相比,引入同质性可使预测准确率提高13–50%,并使解释实际传播和外部趋势时的失真度降低15–25%。
This article investigates the impact of user homophily on the social process of information diffusion in online social media. Over several decades, social scientists have been interested in the idea that similarity breeds connection: precisely known as "homophily". Homophily has been extensively studied in the social sciences and refers to the idea that users in a social system tend to bond more with ones who are similar to them than to ones who are dissimilar. The key observation is that homophily structures the ego-networks of individuals and impacts their communication behavior. It is therefore likely to effect the mechanisms in which information propagates among them. To this effect, we investigate the interplay between homophily along diverse user attributes and the information diffusion process on social media. In our approach, we first extract diffusion characteristics---corresponding to the baseline social graph as well as graphs filtered on different user attributes (e.g. location, activity). Second, we propose a Dynamic Bayesian Network based framework to predict diffusion characteristics at a future time. Third, the impact of attribute homophily is quantified by the ability of the predicted characteristics in explaining actual diffusion, and external variables, including trends in search and news. Experimental results on a large Twitter dataset demonstrate that choice of the homophilous attribute can impact the prediction of information diffusion, given a specific metric and a topic. In most cases, attribute homophily is able to explain the actual diffusion and external trends by ~15-25% over cases when homophily is not considered.
研究动机与目标
- 探究用户在地理位置、活动行为和信息角色等属性上的同质性如何影响社交媒体上的信息传播。
- 开发一种基于同质性用户分组的预测框架,以建模扩散动态。
- 量化同质性在多大程度上能够解释实际扩散模式和外部时间趋势(例如新闻或搜索趋势)。
- 将所提方法与基线技术进行比较,以评估其在同质性条件下预测扩散特征的表现。
提出的方法
- 该框架从基线和社会图谱按属性过滤后的图中提取扩散特征——包括传播量、种子数量、覆盖范围、扩散程度和传播速率。
- 构建动态贝叶斯网络(DBN)以建模扩散的时序演化,将过去扩散状态和同质性属性分组作为输入。
- DBN基于历史模式和特定属性上的用户相似性,预测未来的扩散指标(例如转发数或新增用户数)。
- 引入饱和度和效用指标,以评估预测的扩散在多大程度上能解释实际扩散和外部时间序列趋势。
- 模型在2009年10月至11月期间的大规模Twitter数据集上进行训练和验证,重点关注‘政治’、‘2008年选举’和‘全球变暖’等主题。
- 通过基于共享属性形成用户组来量化同质性,并在每个组内分别分析扩散,以评估特定属性的传播动态。
实验结果
研究问题
- RQ1用户在特定属性(如地理位置、活动行为)上的同质性如何影响在线社交媒体中的信息传播?
- RQ2与忽略同质性的模型相比,用户属性中的同质性在多大程度上能提升信息传播特征的预测能力?
- RQ3当考虑同质性时,预测的扩散模式是否能更准确地解释实际扩散和外部时间趋势(如新闻或搜索趋势)?
- RQ4同质性的影响在不同主题和扩散指标(如覆盖范围与传播速率)之间如何变化?
主要发现
- 与忽略同质性的模型相比,预测模型中引入同质性使解释实际信息传播和外部趋势时的失真度降低了15–25%。
- 所提出的动态贝叶斯网络框架在同质性条件下预测扩散特征的准确率比基线技术高出13–50%。
- 同质性对扩散预测的影响在不同主题和指标间存在显著差异,表明该关系具有情境依赖性。
- 对Twitter上扩散涟漪的可视化显示,当按地理位置、内容创建或活动行为等属性过滤时,扩散模式(如持续时间、用户数量和活动强度)存在显著差异。
- 本研究提供了实证证据,表明同质性以显著方式塑造社交网络结构,从而影响信息传播,即使在控制外部趋势后依然如此。
- 饱和度和效用指标证实,基于同质性的模型比不采用属性分组的模型更能准确捕捉信息传播的底层机制。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。