[论文解读] Efficiently Generating Geometric Inhomogeneous and Hyperbolic Random Graphs
本文提出了首个高效、线性时间的几何异质随机图(GIRGs)生成器,并将其适配至双曲随机图(HRGs),支持非零温度及高维几何结构。该生成器采用优化的几何采样与距离过滤技术,在消费级硬件上实现百万条边图的亚秒级生成,尽管支持更复杂的二项式模型与温度控制,其性能仍优于现有HRG生成器。
Hyperbolic random graphs (HRG) and geometric inhomogeneous random graphs (GIRG) are two similar generative network models that were designed to resemble complex real world networks. In particular, they have a power-law degree distribution with controllable exponent beta, and high clustering that can be controlled via the temperature T. We present the first implementation of an efficient GIRG generator running in expected linear time. Besides varying temperatures, it also supports underlying geometries of higher dimensions. It is capable of generating graphs with ten million edges in under a second on commodity hardware. The algorithm can be adapted to HRGs. Our resulting implementation is the fastest sequential HRG generator, despite the fact that we support non-zero temperatures. Though non-zero temperatures are crucial for many applications, most existing generators are restricted to T = 0. We also support parallelization, although this is not the focus of this paper. Moreover, we note that our generators draw from the correct probability distribution, i.e., they involve no approximation. Besides the generators themselves, we also provide an efficient algorithm to determine the non-trivial dependency between the average degree of the resulting graph and the input parameters of the GIRG model. This makes it possible to specify the desired expected average degree as input. Moreover, we investigate the differences between HRGs and GIRGs, shedding new light on the nature of the relation between the two models. Although HRGs represent, in a certain sense, a special case of the GIRG model, we find that a straight-forward inclusion does not hold in practice. However, the difference is negligible for most use cases.
研究动机与目标
- 开发一种高效、线性时间的几何异质随机图(GIRGs)生成器,支持非零温度与高维几何结构。
- 将GIRG生成器适配至双曲随机图(HRGs),包括支持温度控制的二项式变体,该功能在现有实现中极为罕见。
- 通过线性时间参数估计算法解决输入参数与期望平均度之间的非平凡依赖关系,实现对GIRGs中平均度的精确控制。
- 提供采样算法的清晰、可实现描述,并评估GIRGs与HRGs之间的实际关系。
提出的方法
- 将Bringmann等人[7]的核心采样算法改进,以支持GIRGs中的非零温度与高维空间。
- 实现距离过滤机制,预先计算逆概率以减少边采样过程中的昂贵指数运算,实现约2倍的性能提升。
- 使用Morton码并结合优化的位操作(如BMI2指令)实现d维网格中的高效空间索引与邻居查找。
- 通过在单调函数上进行二分查找,利用线性时间算法计算期望度,估计出能实现目标平均度的参数c。
- 通过部分排序与邻居集合的复用,将边评估成本从O(|ER|)降低至O(|R|),方法为按权重递增顺序处理顶点。
- 通过将昂贵的反双曲余弦函数arccosh替换为cosh(d) < cosh(R)的比较,并预计算中间值,优化双曲距离计算,避免重复昂贵运算。
实验结果
研究问题
- RQ1如何高效实现几何异质随机图(GIRG)生成器,以支持非零温度与高维几何结构,同时保持线性期望时间复杂度?
- RQ2GIRG模型的输入参数与最终平均度之间的非平凡关系是什么?如何高效地实现其反演?
- RQ3所提出的GIRG生成器在性能上与现有HRG生成器相比如何,特别是在二项式(非零温度)情形下?
- RQ4在实践中,GIRGs在多大程度上可近似HRGs?为获得HRGs的子图或超图,平均度需要进行何种调整?
- RQ5核心采样算法能否在保持高性能的前提下适配至HRGs,特别是在支持非零温度时?
主要发现
- 所提出的GIRG生成器在期望线性时间内运行,可在消费级硬件上于一秒内生成包含一千万条边的图。
- 该生成器支持非零温度与高维几何结构,是首个高效实现该功能的GIRG模型生成器。
- 基于同一算法的HRG生成器是目前最快的串行HRG生成器,尽管其支持更复杂的带温度控制的二项式模型。
- 通过线性时间参数估计算法,可精确控制平均度,解决了输入参数与期望度之间的非平凡依赖关系。
- 距离过滤优化通过预计算逆概率,减少了昂贵指数运算的频率,使边采样速度提升约2倍。
- 尽管理论上HRGs可视为GIRGs的特例,但由于几何结构与参数化方式的差异,实际中并不成立;然而,对大多数应用场景而言,该差异可忽略不计。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。