Skip to main content
QUICK REVIEW

[论文解读] A semiparametric extension of the stochastic block model for longitudinal networks

Catarina N. Matias, Tabea Rebafka|arXiv (Cornell University)|Dec 22, 2015
Bayesian Methods and Mixture Models参考文献 47被引用 60
一句话总结

本文提出了一种纵向网络的半参数随机块模型扩展,将重复交互建模为条件非齐次泊松过程,其强度依赖于个体的潜在群体。通过使用基于自适应直方图或核方法的非参数强度估计的半参数变分期望最大化算法,该方法能够在识别潜在群体结构的同时,实现对交互强度的灵活非参数估计,并通过集成分类似然(ICL)进行模型选择,其在合成数据和真实世界数据集(包括Enron和小学接触数据)上表现出色。

ABSTRACT

International audience

研究动机与目标

  • 使用潜在群体结构对连续时间内的重复交互事件进行建模。
  • 开发一种灵活的非参数方法,用于估计交互强度,而无需依赖预设的网络统计量。
  • 通过半参数变分期望最大化算法,实现动态网络中潜在群体的识别。
  • 提供一种模型选择准则(ICL),以确定潜在群体的数量。
  • 在合成数据和真实世界数据集(如Enron邮件和小学接触数据)上展示该方法的性能。

提出的方法

  • 将成对交互建模为条件非齐次泊松过程,其中强度仅依赖于交互个体的潜在群体。
  • 使用半参数变分期望最大化(VEM)算法,将M步替换为非参数强度估计器。
  • 采用两种非参数强度估计方法:自适应直方图划分(Reynaud-Bouret, 2006)和核平滑(Ramlau-Hansen, 1983)。
  • 应用集成分类似然(ICL)准则以选择最优的潜在群体数量。
  • 通过在时间上非参数化建模群体特定交互率 α(q,l),实现时变强度估计。
  • 使用自助抽样法构建估计强度和连接概率的置信区间。

实验结果

研究问题

  • RQ1半参数随机块模型的扩展是否能有效建模连续时间交互事件,而无需假设参数化强度函数?
  • RQ2当交互强度通过非参数方法估计时,所提出的方法在识别动态网络中的潜在群体结构方面表现如何?
  • RQ3ICL准则在纵向网络数据中选择正确潜在群体数量方面的表现如何?
  • RQ4基于直方图和基于核的非参数强度估计器在准确性和自适应性方面有何比较?
  • RQ5该模型在真实世界数据集(如Enron和小学接触数据)中捕捉时变交互模式的能力如何?

主要发现

  • 在正则性条件下,所提出的半参数泊松过程随机块模型具有可识别性,确保参数可唯一恢复。
  • 自适应直方图方法成功估计了非参数强度,通过最优分区选择提升了估计精度,优于固定区间。
  • ICL准则能有效选择潜在群体数量,Enron数据集中最优群体数为Q=4,小学数据集中为Q=17。
  • 在小学数据集中,模型成功捕捉了班级内部的交互模式,其中第1组(4A班)和第3组(1A班)表现出较高的内部交互强度。
  • Enron数据集中Q=10个群体的稀疏模型显示,75%的估计连接概率 βq,l 低于0.1,表明网络结构具有稀疏性。
  • 自助法置信区间证实了估计强度的稳定性,大多数群体对的置信区间在中位数估计值附近较窄,尤其在高活跃度群体中表现明显。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。