Skip to main content
QUICK REVIEW

[论文解读] Description Logic EL++ Embeddings with Intersectional Closure

Peng, Xi, Tang, Zhenwei|arXiv (Cornell University)|Feb 28, 2022
Biomedical Text Mining and Ontologies被引用 2
一句话总结

本文提出ELBE,一种用于描述逻辑EL++的新型嵌入方法,采用轴对齐的超矩形(box)而非n维球体(n-balls)来表示概念,确保了交集封闭性——即两个概念的交集在嵌入空间中仍为有效概念。通过将概念建模为超矩形,并从EL++公理中推导几何约束,ELBE在概念等价性推理任务中表现更优,并在生物医学和合成数据集上优于现有的基于n-ball的方法。

ABSTRACT

Many ontologies, in particular in the biomedical domain, are based on the Description Logic EL++. Several efforts have been made to interpret and exploit EL++ ontologies by distributed representation learning. Specifically, concepts within EL++ theories have been represented as n-balls within an n-dimensional embedding space. However, the intersectional closure is not satisfied when using n-balls to represent concepts because the intersection of two n-balls is not an n-ball. This leads to challenges when measuring the distance between concepts and inferring equivalence between concepts. To this end, we developed EL Box Embedding (ELBE) to learn Description Logic EL++ embeddings using axis-parallel boxes. We generate specially designed box-based geometric constraints from EL++ axioms for model training. Since the intersection of boxes remains as a box, the intersectional closure is satisfied. We report extensive experimental results on three datasets and present a case study to demonstrate the effectiveness of the proposed method.

研究动机与目标

  • 为解决现有基于n-balls的EL++本体嵌入方法中缺乏交集封闭性的问题,该问题导致无法有效表示概念交集。
  • 开发一种几何嵌入方法,确保在交集运算下保持逻辑封闭性,即两个概念的交集在嵌入空间中仍为有效概念。
  • 通过利用超矩形的数学性质,提升EL++嵌入中概念等价性推理与相似度度量的准确性。
  • 通过在真实世界和合成的生物医学数据集上进行广泛评估,证明基于超矩形的嵌入方法的有效性。

提出的方法

  • 将EL++本体中的概念表示为n维嵌入空间中的轴对齐超矩形,每个概念由最小坐标向量(boxmin)和最大坐标向量(boxmax)定义。
  • 设计从EL++公理(如子类关系、概念交集、不相交性)中推导出的几何约束,以指导模型训练并确保逻辑一致性。
  • 采用TransE作为基础的关系建模方法以编码角色关系,尽管该方法未来可扩展至更复杂的模型。
  • 制定损失函数,以强制实现超矩形之间的正确空间关系,包括子类关系、交集关系和不相交关系的约束。
  • 使用边缘损失(margin-based)与对比损失(contrastive loss)相结合的方式,端到端训练模型以优化超矩形表示。
  • 通过计算超矩形的中心点(即boxmin与boxmax的中点)来衡量概念间的相似度,从而支持鲁棒的比较与推理。

实验结果

研究问题

  • RQ1基于超矩形的嵌入能否在EL++嵌入中实现交集封闭性,即两个概念的交集仍为有效概念?
  • RQ2强制实现交集封闭性是否能提升EL++嵌入中概念等价性推理的性能?
  • RQ3在生物医学本体上,ELBE与现有基于n-balls的方法(如ELEm)在推理与相似度预测方面的表现如何比较?
  • RQ4ELBE在嵌入空间中从两个其他概念的交集中准确推断出等价概念的能力有多强?

主要发现

  • ELBE在概念等价性推理任务中达到87.1%的命中率(H@1),显著优于ELEm的71.0%。
  • 在酿酒酵母PPI数据集上,ELBE在召回率H@10指标下取得201的平均排名,优于ELEm(187)及其他基线方法,各项指标均表现更优。
  • 在人类PPI数据集上,ELBE的AUC得分达到0.97(召回率与F1指标均如此),表明其在相似度预测任务中具备出色的泛化能力与鲁棒性。
  • 在全部三个数据集上,ELBE在H@10与H@100指标上均表现出一致的优越性,验证了其在多样化推理任务中的有效性。
  • 在合成数据集上的案例研究证实,ELBE能正确建模交集下的逻辑封闭性,验证了其理论基础的正确性。
  • ELBE的性能提升归因于交集封闭性的满足,这使得等价概念的推理更加准确且稳定。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。