Skip to main content
QUICK REVIEW

[論文レビュー] Conditional Graph Information Bottleneck for Molecular Relational Learning

Namkyeong Lee, Dongmin Hyun|arXiv (Cornell University)|Apr 29, 2023
Computational Drug Discovery Methods被引用数 13
ひとこと要約

CGIB は、条件付き情報ボトルネックを導入し、ペア分子との相互作用を予測する際に最も情報量の多い、1つの分子内のコアサブグラフを特定します。これにより、分子タスク全体での関係学習を改善します。

ABSTRACT

Molecular relational learning, whose goal is to learn the interaction behavior between molecular pairs, got a surge of interest in molecular sciences due to its wide range of applications. Recently, graph neural networks have recently shown great success in molecular relational learning by modeling a molecule as a graph structure, and considering atom-level interactions between two molecules. Despite their success, existing molecular relational learning methods tend to overlook the nature of chemistry, i.e., a chemical compound is composed of multiple substructures such as functional groups that cause distinctive chemical reactions. In this work, we propose a novel relational learning framework, called CGIB, that predicts the interaction behavior between a pair of graphs by detecting core subgraphs therein. The main idea is, given a pair of graphs, to find a subgraph from a graph that contains the minimal sufficient information regarding the task at hand conditioned on the paired graph based on the principle of conditional graph information bottleneck. We argue that our proposed method mimics the nature of chemical reactions, i.e., the core substructure of a molecule varies depending on which other molecule it interacts with. Extensive experiments on various tasks with real-world datasets demonstrate the superiority of CGIB over state-of-the-art baselines. Our code is available at https://github.com/Namkyeong/CGIB.

研究の動機と目的

  • 相互作用を駆動するコアサブストラクチャに焦点を当てる分子関係学習の動機づけ。
  • ペアとなるグラフを条件にして1つのグラフのサブグラフを特定する関係型IBフレームワークを提案する。
  • 入力情報を圧縮しつつ、ターゲットについての予測情報を最大化するサブグラフを学習する。
  • 分子間相互作用、薬物間相互作用、およびグラフ類似性タスク全般における汎用性を示す。

提案手法

  • 条件付き情報ボトルネック(CIB)を定義し、G^2に条件付けられたG^1のコアサブグラフ G_CIB^1 を抽出する。
  • CGIB目的関数を定式化: 最小化 -I(Y; G_CIB^1 | G^2) + β I(G^1; G_CIB^1 | G^2)。
  • GNNベースのエンコーダを用いて両方のグラフのノード埋め込みとコサイン類似度による相互作用マップを取得し、各グラフの結合ノード表現を生成する。
  • ベルヌーイスケールノイズでノード表現を選択的に摂動させて圧縮を導入し、I(G^1; G_CIB^1 | G^2) を最小化する。
  • -I(G_CIB^1; G^2) を最小化する2つのアプローチを提供: 変分IB境界と対照学習バリアント CGIB_cont。
  • 全目的関数 L_total = L_sup + L_pred + β(L_MI^1 + L_MI^2) で学習。
  • アーキテクチャの基本は CIGIN に従い、グラフレベル表現には Set2Set プーリングを用いる。

実験結果

リサーチクエスチョン

  • RQ1条件付き情報ボトルネックは、分子間相互作用を決定する文脈依存のコアサブグラフを特定できるか。
  • RQ2パートナーグラフを条件にサブグラフ発見を行うことは、分子関係タスク全般で予測性能と汎化性能を向上させるか。
  • RQ3分子間相互作用、DDI、グラフ類似性のベンチマークにおけるCGIBは、IBを用いない関係法とどのように比較されるか。
  • RQ4説明可能なコアサブストラクチャ焦点を組み込むことは、化学反応モデリングの解釈性を向上させるか。

主な発見

  • コアサブグラフ焦点を無視する最先端のベースラインより、CGIB は分子間相互作用予測タスクで優れる。
  • CGIB_cont は、対照的な目的を用いてペアリングされたグラフに関する情報を保持することで結果をさらに改善する。
  • 11の実データセットにおいて、CGIBは分子間相互作用、DDI、グラフ類似性タスクの一般化性能に優れている。
  • アブレーション研究は、条件付き情報ボトルネックと提案された圧縮戦略の有効性を確認する。
  • 定性的解析は、CGIB が反応または相互作用決定要因に対応する化学的に意味のあるコアサブストラクチャを発見できることを示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。