Skip to main content
QUICK REVIEW

[论文解读] Few-shot link prediction via graph neural networks for Covid-19 drug-repurposing

Vassilis N. Ioannidis, Da Zheng|arXiv (Cornell University)|Jul 20, 2020
Computational Drug Discovery Methods参考文献 19被引用 30
一句话总结

引入归纳式 Relational GCN (I-RGCN) 在异构知识图上执行少样本链接预测,并将其应用于药物再定位知识图谱 (DRKG) 以用于 Covid-19 药物发现,显示优于基线的方法的性能提升。

ABSTRACT

Predicting interactions among heterogenous graph structured data has numerous applications such as knowledge graph completion, recommendation systems and drug discovery. Often times, the links to be predicted belong to rare types such as the case in repurposing drugs for novel diseases. This motivates the task of few-shot link prediction. Typically, GCNs are ill-equipped in learning such rare link types since the relation embedding is not learned in an inductive fashion. This paper proposes an inductive RGCN for learning informative relation embeddings even in the few-shot learning regime. The proposed inductive model significantly outperforms the RGCN and state-of-the-art KGE models in few-shot learning tasks. Furthermore, we apply our method on the drug-repurposing knowledge graph (DRKG) for discovering drugs for Covid-19. We pose the drug discovery task as link prediction and learn embeddings for the biological entities that partake in the DRKG. Our initial results corroborate that several drugs used in clinical trials were identified as possible drug candidates. The method in this paper are implemented using the efficient deep graph learning (DGL)

研究动机与目标

  • 动机并解决在异构知识图中罕见边类型出现时的少样本链接预测问题。
  • 开发一种归纳式方法,从少量示例中学习关系嵌入。
  • 在标准KG数据集(IMDb、DBLP)以及用于 Covid-19 药物再定位的 DRKG 上展示该方法。
  • 展示归纳式关系学习在少样本和非少样本设定下提升泛化能力。
  • 说明通过链接预测优先考虑现有药物用于 Covid-19 的潜在可能性。

提出的方法

  • 将 Relational Graph Convolutional Networks (RGCN) 扩展为通过多层感知机 (MLP) 归纳地学习关系嵌入。
  • 使用标准的 RGCN 计算节点嵌入,然后通过将参与节点对的嵌入连接后输入到 MLP,推导出关系嵌入 h_r。
  • 使用 DistMult 风格的公式对三元组进行打分,包含 h_n_t, h_r, h_n_t′,并用逻辑损失进行优化。
  • 通过构造负三元组来处理少样本关系,并训练 MLP 以预测罕见关系的真实边与假边。
  • 在可用的节点上使用特征;对于没有特征的节点,采用一个嵌入层。
  • 在 IMDb 和 DBLP 上进行少样本链接预测评估,在 DRKG 上进行 Covid-19 药物再定位评估。

实验结果

研究问题

  • RQ1归纳式机制是否能够在异构图中为罕见边类型学习关系嵌入?
  • RQ2在基准数据集上,I-RGCN 是否相对于标准 RGCN 和知识图嵌入模型提升少样本链接预测?
  • RQ3将归纳式方法有效应用于领域特定任务,如使用 DRKG 的 Covid-19 药物再定位?
  • RQ4学习到的关系嵌入是否也能泛化到非少样本设置?
  • RQ5I-RGCN 方法是否能够从 DRKG 中识别出对 Covid-19 临床相关的药物候选药?

主要发现

  • I-RGCN 在 IMDb 和 DBLP 数据集的少样本链接预测中显著优于基线模型。
  • 随着训练边数增加,RGCN 的性能收敛到 I-RGCN,表明在少样本情形下具有强大的归纳优势。
  • 在基于 DRKG 的 Covid-19 药物再定位上,I-RGCN 识别出在临床试验中出现的若干药物并达到比 RGCN 更高的命中率。
  • 在各项实验中,I-RGCN 展现出强泛化能力,包括在非少样本链接预测设置。
  • 该方法被验证为在 Covid-19 治疗研究中优先考虑现有药物以供进一步研究的实用工具。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。