[论文解读] Edge-exchangeable graphs and sparsity
本文提出边缘交换性随机图作为传统节点交换性模型的替代方案,后者因Aldous–Hoover定理而固有地稠密。通过将交换性重新定义为作用于边而非节点,作者表明边缘交换性可实现边数增长亚二次方的稀疏图模型,支持投影推断,并与现实世界网络的稀疏性一致。
A known failing of many popular random graph models is that the Aldous-Hoover Theorem guarantees these graphs are dense with probability one; that is, the number of edges grows quadratically with the number of nodes. This behavior is considered unrealistic in observed graphs. We define a notion of edge exchangeability for random graphs in contrast to the established notion of infinite exchangeability for random graphs --- which has traditionally relied on exchangeability of nodes (rather than edges) in a graph. We show that, unlike node exchangeability, edge exchangeability encompasses models that are known to provide a projective sequence of random graphs that circumvent the Aldous-Hoover Theorem and exhibit sparsity, i.e., sub-quadratic growth of the number of edges with the number of nodes. We show how edge-exchangeability of graphs relates naturally to existing notions of exchangeability from clustering (a.k.a. partitions) and other familiar combinatorial structures.
研究动机与目标
- 解决节点交换性随机图模型的根本局限,即由于Aldous–Hoover定理而必然导致稠密图的特性。
- 提出一种新的边缘交换性概念,即边的置换不改变图序列的联合分布。
- 证明边缘交换性能支持稀疏图模型——边数增长亚二次方于节点数,与节点交换性模型相反。
- 建立边缘交换性图与现有交换结构(如划分、特征分配和图频率模型)之间的联系。
- 提供一个理论框架,通过随机测度和泊松或伯努利边包含过程构建边缘交换性图。
提出的方法
- 将边缘交换性图定义为边集序列 $E_1 \triangleq E_1, E_2, \ldots$,其中当 $m < n$ 时有 $E_m \subseteq E_n$,且其联合分布对边索引的置换保持不变。
- 通过完全随机测度 $B = \sum_{k=1}^\infty V_k \delta_{\phi_k}$ 表示图的边频率模型,其中每种边类型 $\phi_k$ 具有随机频率 $V_k$。
- 通过在每个时间步独立以概率 $V_k$ 包含每种边类型 $\phi_k$,或通过速率 $\lambda$ 的泊松薄化机制,构建边缘交换性图。
- 引入边缘交换性图过程(EGP),并证明边缘交换性图过程(EGPF)的存在性等价于基于完全随机测度的图频率模型。
- 将框架扩展至特征分配,允许每步添加多个边并支持多重性,并定义边添加步骤上的无限交换性。
- 将边缘交换性图与现有组合结构(如划分和特征分配)联系起来,表明其在交换性原理上的自然类比。
实验结果
研究问题
- RQ1能否为随机图定义一种交换性概念,以避免Aldous–Hoover定理所施加的稠密性约束?
- RQ2边缘交换性是否能支持构建稀疏随机图模型,同时保持投影性并支持流式或分布式推断?
- RQ3边缘交换性与既有的交换结构(如划分、特征分配和随机测度)有何关联?
- RQ4边缘交换性图与基于完全随机测度的图频率模型之间有何联系?
- RQ5边缘交换性模型能否支持现实世界网络中观察到的幂律或其它重尾度分布?
主要发现
- 边缘交换性为非必然稠密的随机图提供了框架,从而规避了Aldous–Hoover定理所保证的边数二次方增长。
- 边缘交换性图过程(EGPF)的存在性等价于一个基于完全随机测度的图频率模型,其速率测度为 $\nu(dw,d\phi) = \nu(dw)G(d\phi)$。
- 可通过在每个时间步独立以概率 $V_k$ 包含每种边类型 $\phi_k$ 的方式,生成一类边缘交换性图,其中 $V_k$ 是来自完全随机测度的频率。
- 通过在每步添加泊松分布的新增唯一边数,该模型可生成具有EGPF的边缘交换性图,且所有此类图均可由此构造得出。
- 该模型支持多重性及每步添加多个边,推广至特征分配,实现更丰富的图动态。
- 该框架自然扩展至已知的稀疏模型,如Caron和Fox(2015)提出的模型,将其嵌入更广泛的边缘交换性概率结构中。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。