Skip to main content
QUICK REVIEW

[论文解读] Uncovering Biological Network Function via Graphlet Degree Signatures

Tijana Milenković, Nataša Pržulj|ArXiv.org|Feb 5, 2008
Bioinformatics and Genomic Networks参考文献 5被引用 82
一句话总结

本文提出图谱度签名(GDS)以通过分析PPI网络中蛋白质邻域的拓扑相似性,揭示生物网络功能。通过使用2–5个节点的图谱比较局部网络结构,该方法识别出具有共享功能、亚细胞定位及复合物成员关系的蛋白质簇,预测蛋白质复合物成员关系的命中率最高可达100%,并能准确注释未分类酵母蛋白的功能。

ABSTRACT

Proteins are essential macromolecules of life and thus understanding their function is of great importance. The number of functionally unclassified proteins is large even for simple and well studied organisms such as baker's yeast. Methods for determining protein function have shifted their focus from targeting specific proteins based solely on sequence homology to analyses of the entire proteome based on protein-protein interaction (PPI) networks. Since proteins aggregate to perform a certain function, analyzing structural properties of PPI networks may provide useful clues about the biological function of individual proteins, protein complexes they participate in, and even larger subcellular machines. We design a sensitive graph theoretic method for comparing local structures of node neighborhoods that demonstrates that in PPI networks, biological function of a node and its local network structure are closely related. The method groups topologically similar proteins under this measure in a PPI network and shows that these protein groups belong to the same protein complexes, perform the same biological functions, are localized in the same subcellular compartments, and have the same tissue expressions. Moreover, we apply our technique on a proteome-scale network data and infer biological function of yet unclassified proteins demonstrating that our method can provide valuable guidelines for future experimental research.

研究动机与目标

  • 建立PPI网络中局部网络拓扑与生物功能、蛋白质复合物及亚细胞定位之间的强关联。
  • 解决在蛋白质组规模网络中预测未表征蛋白功能的挑战,特别是在面包酵母等研究充分的生物体中。
  • 开发一种基于拓扑的聚类方法,使蛋白质聚类不仅基于密度或连通性,还基于其邻域的结构相似性。
  • 在不同生物体(酵母和人类)及多种PPI网络来源(包括高通量和小规模数据)上验证该方法。
  • 提供一种可扩展、可并行化的计算框架,用于未分类蛋白质的功能注释,为未来实验研究提供指导。

提出的方法

  • 该方法使用所有连通的2–5个节点图谱(子图)为每个节点计算图谱度签名(GDS),捕捉每个节点在每种图谱类型中出现的次数。
  • 通过在[0, 1]区间内的归一化相似性评分比较GDS向量,衡量节点间的相似性,数值越高表示邻域拓扑越相似。
  • 基于GDS相似性对蛋白质进行聚类,形成具有高度拓扑和功能一致性的群体。
  • 该方法采用严格和灵活两种函数预测方案:灵活方案通过容忍注释功能中的微小不一致,实现更高的命中率。
  • 该算法计算量较大(O(|V|⁵)),但具备可并行化特性,支持大规模PPI网络的可扩展性。
  • 该方法具有通用性,可推广至PPI以外的其他生物网络和现实世界网络,因其基于图谱的拓扑分析基础。

实验结果

研究问题

  • RQ1在PPI网络中,蛋白质邻域的局部拓扑结构在多大程度上可预测其生物功能?
  • RQ2蛋白质邻域结构的拓扑相似性是否能可靠地将蛋白质分组至相同的蛋白质复合物、功能类别和亚细胞区室?
  • RQ3图谱度签名是否能在准确性和敏感性方面优于传统的基于邻域或聚类的功能预测方法?
  • RQ4该方法在预测蛋白质组规模网络中未分类蛋白质的功能方面表现如何,特别是在面包酵母中?
  • RQ5网络拓扑与生物功能之间的关系是否在不同生物体及PPI网络类型(如高通量与小规模)之间保持保守?

主要发现

  • 在vonMering-core PPI网络中,采用灵活方案时,44%的簇在预测蛋白质复合物成员关系方面达到100%命中率,验证了该方法的准确性。
  • 对于度数大于4的未分类酵母蛋白,严格方案下17个测试案例中有14个命中率在50%或以上,灵活方案下17个中有16个达到该水平。
  • 该方法成功预测未表征的PWP1蛋白参与rRNA加工,与SGD中已知功能一致。
  • 基于GDS相似性分组的蛋白质在酿酒酵母和人类网络中,显著富集于共享的生物功能、亚细胞定位及组织表达。
  • 该方法在多种PPI网络中表现出鲁棒性,包括源自TAP和HMS-PCI高通量方法的网络,这些方法已知富集蛋白质复合物。
  • 簇的漏检率较低,仅少数簇内注释节点缺乏与其他成员的共同功能,表明预测簇具有高度的功能一致性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。