QUICK REVIEW

[论文解读] Graph Embedding via Diffusion-Wavelets-Based Node Feature Distribution Characterization

Lili Wang, Cheng‐Han Huang|arXiv (Cornell University)|Sep 14, 2021

Advanced Graph Neural Networks参考文献 33被引用 12

一句话总结

该论文提出了一种新颖的无监督全图嵌入方法，利用扩散小波捕捉 k-跳子图中的拓扑相似性，并通过特征函数表征节点特征分布。通过聚合这些函数并使用最小差异对分配（MDPA）来度量拓扑相似性，该方法在四个真实世界数据集上的图分类任务中实现了最先进性能，优于包括 FEATHER 在内的 12 个基线方法。

ABSTRACT

Recent years have seen a rise in the development of representational learning methods for graph data. Most of these methods, however, focus on node-level representation learning at various scales (e.g., microscopic, mesoscopic, and macroscopic node embedding). In comparison, methods for representation learning on whole graphs are currently relatively sparse. In this paper, we propose a novel unsupervised whole graph embedding method. Our method uses spectral graph wavelets to capture topological similarities on each k-hop sub-graph between nodes and uses them to learn embeddings for the whole graph. We evaluate our method against 12 well-known baselines on 4 real-world datasets and show that our method achieves the best performance across all experiments, outperforming the current state-of-the-art by a considerable margin.

研究动机与目标

解决图分类任务中缺乏有效的无监督全图嵌入方法的问题。
利用谱图小波对 k-跳子图中的节点特征分布进行建模。
确保对图同构的不变性以及对特征噪声的鲁棒性。
在图分类任务中超越现有最先进方法。

提出的方法

基于图拉普拉斯矩阵使用扩散小波计算反映拓扑角色的谱小波系数。
应用带缩放参数 𝜏 的热核滤波器以平滑信号并强调结构相似性。
计算 k-跳子图内节点特征的特征函数，以表示局部特征分布。
采用 MDPA（地球移动距离的一种变体）度量节点能量分布之间的拓扑相似性。
聚合节点间的特征函数，并采样代表性点以形成 d 维的图级嵌入。
使用归一化邻接矩阵和转移概率以增强对特征噪声的鲁棒性。

实验结果

研究问题

RQ1扩散小波能否有效捕捉 k-跳子图中节点之间的拓扑相似性，以实现图级表征？
RQ2聚合子图中节点特征的特征函数能否生成具有判别力的全图嵌入？
RQ3所提出的方法是否对图同构保持不变且对特征噪声具有鲁棒性？
RQ4该方法是否在图分类任务中超越现有最先进方法？

主要发现

在 GitHub Repos 数据集上，该方法实现了 0.772 ± 0.002 的最高平均 AUC 得分，优于次优基线方法 FEATHER 的 0.728 ± 0.002。
在 Reddit Threads 数据集上，该方法实现了 0.835 ± 0.001 的 AUC 得分，优于 FEATHER（0.823 ± 0.001）及其他所有基线方法。
该方法在所有四个真实世界数据集（GitHub Repos、Reddit Threads、Twitch Egos 和 Deezer Egos）上均表现出强大的泛化能力，实现了最先进性能。
超参数敏感性分析表明，该方法在 𝑘𝑚𝑎𝑥、𝑑 和 𝜏 的不同取值下均表现稳定，表明对超参数的敏感度较低。
理论分析证实，该方法对同构图产生相同的嵌入，并且对特征噪声具有鲁棒性，其证明基于特征函数差异中的有界扰动。
即使在缺乏节点特征的数据集中，该方法仍能实现优异性能，通过手动注入对数度和聚类系数作为特征。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。