Skip to main content
QUICK REVIEW

[论文解读] A Theory of Random Graph Shift in Truncated-Spectrum vRKHS

Zhang Wan, Tingting Mu|arXiv (Cornell University)|Feb 27, 2026
Advanced Graph Neural Networks被引用 0
一句话总结

本论文在使用随机图模型和截断谱向量值 RKHS 的框架下,建立了域偏移下的图分类理论,推导出一个将迁移风险分解为域差异、谱几何与振幅的域自适应界,并在真实数据与合成数据上给出经验验证。

ABSTRACT

This paper develops a theory of graph classification under domain shift through a random-graph generative lens, where we consider intra-class graphs sharing the same random graph model (RGM) and the domain shift induced by changes in RGM components. While classic domain adaptation (DA) theories have well-underpinned existing techniques to handle graph distribution shift, the information of graph samples, which are itself structured objects, is less explored. The non-Euclidean nature of graphs and specialized architectures for graph learning further complicate a fine-grained analysis of graph distribution shifts. In this paper, we propose a theory that assumes RGM as the data generative process, exploiting its connection to hypothesis complexity in function space perspective for such fine-grained analysis. Building on a vector-valued reproducing kernel Hilbert space (vRKHS) formulation, we derive a generalization bound whose shift penalty admits a factorization into (i) a domain discrepancy term, (ii) a spectral-geometry term summarized by the accessible truncated spectrum, and (iii) an amplitude term that aggregates convergence and construction-stability effects. We empirically verify the insights on these terms in both real data and simulations.

研究动机与目标

  • 通过类级随机图模型(RGM)建模图分布的偏移。
  • 在截断谱的 vRKHS 中推导用于图分类的域自适应泛化界。
  • 将迁移惩罚分解为域差异、谱几何与振幅项。
  • 将理论与如潜在 Wasserstein 距离和截断谱等实际代理联系起来。
  • 在真实与仿真图数据上经验性验证理论因素。

提出的方法

  • 用核 W、潜在 P 和特征映射 f 正式化生成图的 RGMs。
  • 在有限谱假设下,采用向量值 RKHS (vRKHS) 框架进行多类图自适应(AD)。
  • 推导将迁移惩罚分解为散度、几何(通过截断谱)和振幅项的域自适应界。
  • 通过截断特征值谱(λ_r)和无穷范数分歧表达 vRKHS 范数,并给出与体系结构及数据相关的常数。
  • 将界与实际代理如潜在 Wasserstein 距离和谱截断分析联系起来。
  • 给出证明并讨论在 RGM 偏移下 GNN 的含义。
Figure 4 : Eigenvalues on IMDB-MULTI (1k), NCI1 (2k), PROTEINS (1k).
Figure 4 : Eigenvalues on IMDB-MULTI (1k), NCI1 (2k), PROTEINS (1k).

实验结果

研究问题

  • RQ1域偏移如何在面向类的图 RGM 中表现并如何在潜在空间中量化?
  • RQ2在有限谱假设下,图分类的域自适应误差是否可在 vRKHS 框架下有界?
  • RQ3谱几何(截断谱)在跨域可迁移性中的作用是什么?
  • RQ4收敛性、优化和标注不匹配(振幅项)如何影响在 RGM 偏移下的迁移?
  • RQ5哪些实际代理(如潜在 Wasserstein 距离、谱截断)能体现理论并指导经验评估?

主要发现

  • 在截断谱的 vRKHS 中得到图域自适应的一般化界,将迁移惩罚分解为域差异、谱几何与振幅。
  • 域发散与类级 RGM 间的潜在 Wasserstein 距离相关,为偏移量提供代理。
  • 在有限谱假设下,vRKHS 范数可被特征值 λ_r 和无穷范数分歧约束,从而澄清几何与振幅的作用。
  • 振幅项综合了收敛性与优化稳定性等效应,包括模型及数据相关扰动。
  • 在真实与仿真数据上的经验验证支持三大界因子的定性相关性,并揭示有限秩行为与图规模效应。
  • 该框架通过收敛性结果与构造-稳定性分析,将连续 RGMs 与离散 GNN 训练联系起来。
Figure 5 : $d_{\mathrm{eff}}$ on IMDB-MULTI (1k), NCI1 (2k), PROTEINS (1k).
Figure 5 : $d_{\mathrm{eff}}$ on IMDB-MULTI (1k), NCI1 (2k), PROTEINS (1k).

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。