Skip to main content
QUICK REVIEW

[论文解读] Conditional Graph Information Bottleneck for Molecular Relational Learning

Namkyeong Lee, Dongmin Hyun|arXiv (Cornell University)|Apr 29, 2023
Computational Drug Discovery Methods被引用 13
一句话总结

CGIB 引入一个条件信息瓶颈,用于识别一个分子内对预测与配对分子相互作用最具信息量的核心子图,从而提升跨分子任务的关系学习。

ABSTRACT

Molecular relational learning, whose goal is to learn the interaction behavior between molecular pairs, got a surge of interest in molecular sciences due to its wide range of applications. Recently, graph neural networks have recently shown great success in molecular relational learning by modeling a molecule as a graph structure, and considering atom-level interactions between two molecules. Despite their success, existing molecular relational learning methods tend to overlook the nature of chemistry, i.e., a chemical compound is composed of multiple substructures such as functional groups that cause distinctive chemical reactions. In this work, we propose a novel relational learning framework, called CGIB, that predicts the interaction behavior between a pair of graphs by detecting core subgraphs therein. The main idea is, given a pair of graphs, to find a subgraph from a graph that contains the minimal sufficient information regarding the task at hand conditioned on the paired graph based on the principle of conditional graph information bottleneck. We argue that our proposed method mimics the nature of chemical reactions, i.e., the core substructure of a molecule varies depending on which other molecule it interacts with. Extensive experiments on various tasks with real-world datasets demonstrate the superiority of CGIB over state-of-the-art baselines. Our code is available at https://github.com/Namkyeong/CGIB.

研究动机与目标

  • 推动分子关系学习,聚焦于驱动相互作用的核心子结构。
  • 提出一个关系型信息瓶颈框架,在配对图条件下识别一个图的子图。
  • 学习在最大化关于目标的预测信息同时压缩输入信息的子图。
  • 展示在分子相互作用、药物-药物相互作用以及图相似性等任务上的通用性。

提出的方法

  • 定义条件信息瓶颈(CIB),从 G^1 提取在 G^2 条件下的核心子图 G_CIB^1。
  • 给出 CGIB 目标:最小化 -I(Y; G_CIB^1 | G^2) + β I(G^1; G_CIB^1 | G^2)。
  • 使用基于 GNN 的编码器获取两图的节点嵌入,并通过余弦相似度得到交互映射,生成每个图的融合节点表示。
  • 通过有选择地用伯努利缩放噪声扰动节点表示,引入基于噪声的压缩,以最小化 I(G^1; G_CIB^1 | G^2)。
  • 提供两种最小化 -I(G_CIB^1; G^2) 的方法:一种变分 IB 上界和一种对比学习变体 CGIB_cont。
  • 以总目标 L_total = L_sup + L_pred + β(L_MI^1 + L_MI^2) 进行训练。
  • 基础架构遵循 CIGIN,并使用 Set2Set 池化获取图级表示。

实验结果

研究问题

  • RQ1条件信息瓶颈是否能够识别决定分子相互作用的、依赖上下文的核心子图?
  • RQ2将子图发现条件化在配对图上是否能提升预测性能和跨分子关系任务的泛化能力?
  • RQ3在分子相互作用、DDI 和图相似性基准测试中,CGIB 与非 IB 的关系方法相比有何差异?
  • RQ4引入可解释的核心子结构焦点是否提高化学反应建模的可解释性?

主要发现

  • CGIB 在忽略核心子图焦点的最先进基线方法上,分子相互作用预测任务表现更优。
  • CGIB_cont 通过使用对比目标来保持关于配对图的信息,从而进一步提升结果。
  • 在十一个真实数据集上,CGIB 展现出在分子相互作用、DDI 和图相似性任务上的更强泛化能力。
  • 消融研究证实了条件信息瓶颈和所提出的压缩策略的有效性。
  • 定性分析表明 CGIB 能揭示与反应或相互作用决定因素相对应的具有化学意义的核心子结构。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。