Skip to main content
QUICK REVIEW

[论文解读] Homogeneous temporal activity patterns in a large online communication space

Andreas Kaltenbrunner, Vicenç Gómez|ArXiv.org|Aug 12, 2007
Complex Network Analysis Techniques参考文献 23被引用 35
一句话总结

本研究分析了Slashdot用户生成评论系统中的时间活动模式,发现不同帖子的评论间隔时间遵循对数正态分布,表明尽管底层社区存在异质性,但行为具有同质性。双对数正态模型进一步捕捉了日周期和周周期的波动,表明少数关键参数即可高精度预测大型在线论坛中的社交互动动态。

ABSTRACT

The many-to-many social communication activity on the popular technology-news website Slashdot has been studied. We have concentrated on the dynamics of message production without considering semantic relations and have found regular temporal patterns in the reaction time of the community to a news-post as well as in single user behavior. The statistics of these activities follow log-normal distributions. Daily and weekly oscillatory cycles, which cause slight variations of this simple behavior, are identified. A superposition of two log-normal distributions can account for these variations. The findings are remarkable since the distribution of the number of comments per users, which is also analyzed, indicates a great amount of heterogeneity in the community. The reader may find surprising that only a few parameters allow a detailed description, or even prediction, of social many-to-many information exchange in this kind of popular public spaces.

研究动机与目标

  • 探究在大型在线讨论论坛中,尽管社交互动存在异质性,是否存在同质的时间模式。
  • 确定用户评论之间的事件间隔时间是否遵循特定的统计分布,即使在语义和用户多样性存在的情况下。
  • 评估一组少量参数是否能够描述或预测多对多在线交流中的信息传播动态。
  • 探讨日周期和周周期在塑造技术新闻平台评论活动模式中的作用。

提出的方法

  • 本研究分析了Slashdot一年的服务器日志,聚焦于评论间隔时间,不考虑语义内容。
  • 使用最大似然估计法,将事件间隔时间分布拟合到对数正态(LN)和双对数正态(DLN)概率密度函数。
  • 通过时间分箱中实际存在评论的区间,使用归一化的ℓ¹-范数误差度量来量化经验数据与模型预测之间的误差。
  • 使用对数正态分布的误差函数表示法,对评论活动的累积分布函数(CDF)进行建模。
  • 双对数正态模型通过混合参数将两个独立的对数正态分布结合,以解释周期性变化。
  • 分析聚焦于发帖后前10天,此时中位数评论活动在早期达到峰值,从而可实现对讨论持续时间的早期预测。

实验结果

研究问题

  • RQ1在像Slashdot这样的大型公共平台中,尽管用户和主题多样,多对多在线讨论是否表现出同质的时间模式?
  • RQ2评论间隔时间的分布最好由对数正态分布描述,还是由两个对数正态分布的叠加描述?
  • RQ3日周期和周周期在多大程度上调制了在线讨论中潜在的对数正态活动模式?
  • RQ4能否利用早期评论活动(发帖后数小时内)来预测讨论的整体持续时间和强度?
  • RQ5与用户行为和主题异质性的复杂性相比,少数参数模型在预测信息传播方面的简洁性如何?

主要发现

  • 不同Slashdot帖子之间的评论间隔时间遵循对数正态分布,表明其背后存在同质的时间模式。
  • 双对数正态模型通过混合参数结合两个对数正态分布,相较于单一对数正态分布,能更显著地拟合日周期和周周期的波动。
  • 中位数评论活动在发帖后数小时内达到峰值,超过90%的总评论发生在前10天内。
  • 经验数据与双对数正态模型之间的误差度量ε始终较低,表明对早期评论动态具有高预测精度。
  • 尽管每位用户的评论数量存在高度异质性,但评论生成的时间动态在不同帖子之间表现出显著的一致性。
  • 模型的高精度表明,早期评论模式可用于高可靠度地预测在线讨论的长期发展轨迹。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。