[论文解读] Inference for multiple heterogeneous networks with a common invariant subspace
本文提出 COSIE,一种用于具有共享不变量子空间的多对齐图的灵活模型,以及 MASE 谱嵌入,用以联合估计共同结构和图特定参数,实现跨异质网络的可扩展推断。
The development of models and methodology for the analysis of data from multiple heterogeneous networks is of importance both in statistical network theory and across a wide spectrum of application domains. Although single-graph analysis is well-studied, multiple graph inference is largely unexplored, in part because of the challenges inherent in appropriately modeling graph differences and yet retaining sufficient model simplicity to render estimation feasible. This paper addresses exactly this gap, by introducing a new model, the common subspace independent-edge multiple random graph model, which describes a heterogeneous collection of networks with a shared latent structure on the vertices but potentially different connectivity patterns for each graph. The model encompasses many popular network representations, including the stochastic blockmodel. The model is both flexible enough to meaningfully account for important graph differences, and tractable enough to allow for accurate inference in multiple networks. In particular, a joint spectral embedding of adjacency matrices-the multiple adjacency spectral embedding-leads to simultaneous consistent estimation of underlying parameters for each graph. Under mild additional assumptions, the estimates satisfy asymptotic normality and yield improvements for graph eigenvalue estimation. In both simulated and real data, the model and the embedding can be deployed for a number of subsequent network inference tasks, including dimensionality reduction, classification, hypothesis testing, and community detection. Specifically, when the embedding is applied to a data set of connectomes constructed through diffusion magnetic resonance imaging, the result is an accurate classification of brain scans by human subject and a meaningful determination of heterogeneity across scans of different individuals.
研究动机与目标
- 为一组对齐的图构建并发展一个半参数模型,捕捉共享的潜在结构,同时允许图特定的异质性。
- 引入一个实用、可扩展的估计过程,利用跨图的公共子空间来估计共享参数和图特定参数。
- 展示估计量的理论性质,包括在温和的稀疏性假设下的一致性和渐近正态性。
- 展示 COSIE 框架如何支持下游任务,如降维、分类、假设检验和社区检测。
- 在仿真数据和真实连接组数据上验证该方法,以说明推断和分类性能的提升。
提出的方法
- 定义 COSIE 模型,其中每个图的期望为 V R^(i) V^T,具有公共的正交子空间 V 和图特定的得分矩阵 R^(i)。
- 使用邻接谱嵌入来获得 \\hat{X}^(i),并通过将顶点嵌入堆叠起来,提取前 d 个左奇异向量来估计 V,构建多重邻接谱嵌入(MASE)。
- 给定估计的 V,通过最小二乘法估计 R^(i),即 R^(i) = V^T A^(i) V。
- 证明公共子空间 V 在正交变换下的一致性,并在淡化假设和温和的稀疏性条件下建立 R^(i) 的渐近正态性。
- 给出一个理论界限,表示 E[min_W in O_d ||\\hat{V} - V W||_F] <= C(1/sqrt(nm) + 1/n) 并讨论随 m 衰减的偏差项。
- 讨论可识别性结果,以及 R^(i) 和 V 如何在正交变换下可识别,对下游推断的影响。
实验结果
研究问题
- RQ1一个简单、灵活的多图模型是否能够在保持可处理性的同时逼近真实世界的异质网络?
- RQ2如何利用共享子空间结构来跨多图估计图特定参数?
- RQ3在温和稀疏性下,所提出估计量的统计性质(的一致性、渐近正态性)是什么?
- RQ4COSIE–MASE 框架如何用于对一组图的社区检测、分类和假设检验等任务?
- RQ5该方法在仿真数据和真实连通组数据上的表现相较于现有方法如何?
主要发现
- MASE 可得出公共子空间 V 和图特定得分矩阵 R^(i) 的一致性估计。
- 在温和稀疏性和去局部化下,R^(i) 在对齐的 Procrustes 之后具有渐近正态性。
- 该方法提供有限样本界,表明子空间估计误差随图数量 m 和图大小 n 同时减小。
- COSIE 泛化了包括随机分块模型在内的若干现有模型,并将维度从 O(mn^2) 降至 O(nd + md^2)。
- MASE 使跨多图的降维、分类、假设检验和社区检测等下游任务成为可能。
- 对真实连通组数据的实证结果显示准确的受试者分类和跨受试者的有意义的异质性评估。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。