[论文解读] Spectral Graph Convolutions on Population Graphs for Disease Prediction
本文提出了一种新颖的图卷积网络(GCN)框架,通过将人群建模为稀疏图,整合脑影像与非影像数据,其中节点代表具有影像特征的受试者,边编码表型相似性。该方法在ADNI数据集上预测MCI转化的准确率达到77%,在ABIDE数据集上达到69.5%,通过结合个体特征与受试者间关系,优于当前最先进方法。
Exploiting the wealth of imaging and non-imaging information for disease prediction tasks requires models capable of representing, at the same time, individual features as well as data associations between subjects from potentially large populations. Graphs provide a natural framework for such tasks, yet previous graph-based approaches focus on pairwise similarities without modelling the subjects' individual characteristics and features. On the other hand, relying solely on subject-specific imaging feature vectors fails to model the interaction and similarity between subjects, which can reduce performance. In this paper, we introduce the novel concept of Graph Convolutional Networks (GCN) for brain analysis in populations, combining imaging and non-imaging data. We represent populations as a sparse graph where its vertices are associated with image-based feature vectors and the edges encode phenotypic information. This structure was used to train a GCN model on partially labelled graphs, aiming to infer the classes of unlabelled nodes from the node features and pairwise associations between subjects. We demonstrate the potential of the method on the challenging ADNI and ABIDE databases, as a proof of concept of the benefit from integrating contextual information in classification tasks. This has a clear impact on the quality of the predictions, leading to 69.5% accuracy for ABIDE (outperforming the current state of the art of 66.8%) and 77% for ADNI for prediction of MCI conversion, significantly outperforming standard linear classifiers where only individual features are considered.
研究动机与目标
- 解决现有基于图的模型忽略个体受试者特征而仅依赖成对相似性的问题。
- 通过整合个体影像特征与受试者间关系,提升神经退行性疾病与神经发育障碍的疾病预测性能。
- 开发一种能够处理部分标记人群图的GCN框架,以实现有效分类。
- 在真实世界神经影像数据库(如ADNI与ABIDE)上验证模型的有效性。
提出的方法
- 将人群表示为稀疏图,其中节点对应具有影像特征向量的个体受试者。
- 将受试者之间的表型相似性编码为边权重,以捕捉受试者间的关系。
- 在部分标记的图上训练图卷积网络,利用节点特征与图结构预测未标记节点的类别。
- 应用谱系图卷积操作,聚合邻近节点的信息,同时保留个体特异性特征。
- 采用一种能够跨图传播并优化特征的GCN架构,实现对个体数据与关系数据的联合建模。
- 使用交叉熵损失函数端到端优化模型,用于节点分类任务。
实验结果
研究问题
- RQ1与仅使用个体特征的模型相比,整合个体影像特征与受试者间表型相似性是否能提升疾病预测性能?
- RQ2基于GCN的人群图方法在神经退行性疾病与神经发育障碍分类中的有效性如何?
- RQ3通过图边对受试者关系进行建模,在部分标记的人群数据集中能在多大程度上提升预测准确率?
- RQ4所提出方法是否在ADNI与ABIDE等基准神经影像数据库上优于当前最先进方法?
主要发现
- 所提出的GCN模型在ADNI数据集上预测MCI转化的准确率达到77%,显著优于仅使用个体特征的标准线性分类器。
- 在ABIDE数据集上,该模型在自闭症谱系障碍分类中达到69.5%的准确率,超过先前最先进水平的66.8%。
- 与仅依赖个体特征的模型相比,整合受试者特异性影像特征与受试者间表型关系可显著提升分类性能。
- 结果表明,通过图结构对人群层面关系进行建模,可增强神经影像分类任务中的预测能力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。