Skip to main content
QUICK REVIEW

[论文解读] Planetary-Scale Views on an Instant-Messaging Network

Jure Leskovec, Eric Horvitz|ArXiv.org|Mar 6, 2008
Complex Network Analysis Techniques参考文献 18被引用 72
一句话总结

本论文基于2006年6月一个月内2.4亿名Microsoft Messenger用户匿名通信数据,构建了一个包含1.8亿活跃用户和13亿条通信关系的全球规模社交网络。研究发现,平均最短路径长度为6.6,证实了‘六度分隔’理论,略有偏差;同时揭示了按语言、地理位置和年龄的强烈同质性,但跨性别对话更为频繁且持续时间更长。

ABSTRACT

We present a study of anonymized data capturing a month of high-level communication activities within the whole of the Microsoft Messenger instant-messaging system. We examine characteristics and patterns that emerge from the collective dynamics of large numbers of people, rather than the actions and characteristics of individuals. The dataset contains summary properties of 30 billion conversations among 240 million people. From the data, we construct a communication graph with 180 million nodes and 1.3 billion undirected edges, creating the largest social network constructed and analyzed to date. We report on multiple aspects of the dataset and synthesized graph. We find that the graph is well-connected and robust to node removal. We investigate on a planetary-scale the oft-cited report that people are separated by ``six degrees of separation'' and find that the average path length among Messenger users is 6.6. We also find that people tend to communicate more with each other when they have similar age, language, and location, and that cross-gender conversations are both more frequent and of longer duration than conversations with the same gender.

研究动机与目标

  • 利用匿名即时通信数据,在全球尺度上分析大规模人类通信模式。
  • 基于现实世界通信活动,构建并研究迄今为止最大的社交网络。
  • 在真实全球通信网络中检验‘六度分隔’假说。
  • 研究人口统计因素(性别、年龄、语言和地理位置)对通信频率和持续时间的影响。
  • 评估网络在节点移除情况下的鲁棒性及结构性质,如连通性、聚类系数和路径长度。

提出的方法

  • 收集2006年6月Microsoft Messenger的匿名高层次通信元数据,不包含消息内容。
  • 构建一个无向通信图,包含1.8亿个节点(活跃用户)和13亿条边(至少通信一次的用户对)。
  • 使用网络分析技术计算最短路径长度、聚类系数和连通分量大小。
  • 通过多种排序标准(度数、会话次数、消息量、每次会话时长)模拟节点移除,评估网络鲁棒性。
  • 通过比较用户属性(性别、年龄、语言和地理位置)之间的通信模式,分析同质性。
  • 使用空间相关性分析,研究地理距离与通信频率/持续时间之间的关系。

实验结果

研究问题

  • RQ1在全局规模的即时通信网络中,用户之间的平均最短路径长度是多少?
  • RQ2性别、年龄、语言和地理位置等人口统计属性如何影响通信频率和持续时间?
  • RQ3同质性在大规模社交网络中在多大程度上塑造了通信模式?
  • RQ4该通信网络对有针对性与随机节点移除的鲁棒性如何?
  • RQ5在全局网络中,地理距离与通信模式之间存在何种相关性?

主要发现

  • Messenger网络的平均最短路径长度为6.6(中位数为6),证实了‘六度分隔’原则,略有增加。
  • 1.8亿活跃用户中99.9%属于最大连通分量,表明网络具有极强的连通性。
  • 聚类系数的衰减指数为-0.37,表明存在显著的局部聚类,但低于先前分层模型的预期值。
  • 同质性在语言方面最强,其次是地理位置和年龄,用户更倾向于与相似个体频繁且长时间通信。
  • 与同质性预期相反,跨性别对话比同性别互动更频繁且持续时间更长。
  • 通信频率随地理距离增加而下降,但远距离连接平均携带更多消息且会话时间更长。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。