Skip to main content
QUICK REVIEW

[论文解读] Semantics-Aware Caching for Concept Learning

Louis Mozart Kamdem Teyou, Caglar Demir|arXiv (Cornell University)|Mar 6, 2026
Advanced Graph Neural Networks被引用 0
一句话总结

一个语义感知缓存层在描述逻辑推理器中加速概念检索,显著提升跨符号与神经符号设置的概念学习流水线的速度。

ABSTRACT

Concept learning is a form of supervised machine learning that operates on knowledge bases in description logics. State-of-the-art concept learners often rely on an iterative search through a countably infinite concept space. In each iteration, they retrieve instances of candidate solutions to select the best concept for the next iteration. While simple learning problems might require a few dozen instance retrieval calls to find a fitting solution, complex learning problems might necessitate thousands of calls. We alleviate the resulting runtime challenge by presenting a semantics-aware caching approach. Our cache is essentially a subsumption-aware map that links concepts to a set of instances via crisp set operations. Our experiments on 5 datasets with 4 symbolic reasoners, a neuro-symbolic reasoner, and 5 popular pagination policies demonstrate that our cache can reduce the runtime of concept retrieval and concept learning by an order of magnitude while being effective for both symbolic and neuro-symbolic reasoners.

研究动机与目标

  • 识别概念学习中的运行时瓶颈(对候选概念的重复推理)。
  • 提出一个利用子含关系的语义感知缓存,以重用先前计算的实例集合。
  • 在多组数据集、推理器和缓存替换策略中评估缓存影响。
  • 证明缓存集成可带来显著的运行时节省,并可推广到神经符号推理。

提出的方法

  • 引入一个利用清晰集合运算将概念映射到实例集的子含感知缓存。
  • 利用 AL C 语义通过识别的子含关系以及轻量级的句法启发式方法来减少候选检索。
  • 缓存初始化预计算常见原语的 Ret(A)、Ret(¬A) 和 Ret(∃r.A) 以加速热启动。
  • 实现一个 fetchInstances 程序,利用语义分解与缓存结果来最小化推理器调用。
  • 评估五种替换策略(FIFO、LIFO、LRU、MRU、RP),并比较语义缓存与非语义缓存。
  • 在四个数据集、四个符号推理器以及一个神经符号推理器(Ebr)上进行测试。
(a) Carcinogenesis
(a) Carcinogenesis

实验结果

研究问题

  • RQ1语义感知缓存是否在不同推理器上降低概念检索时间?
  • RQ2缓存大小和替换策略如何影响概念检索的运行时和命中率?
  • RQ3缓存对符号与神经符号概念学习任务是否都有效?
  • RQ4缓存初始化对小数据集与大数据集的性能影响是什么?

主要发现

  • 当缓存容量充足时,慢推理器的概念检索时间可降低多达80%,而较快的推理器可降低多达20%。
  • 在概念学习中,缓存可把整体运行时降低多达三个数量级。
  • LRU 在不同推理器和数据集之间始终提供运行时减少与缓存效率之间的最佳折衷。
  • 热(初始化)缓存随着缓存规模增大而带来更稳定、更新更快的改进,尽管启动成本更高。
  • 非语义缓存几乎没有改进,凸显了利用语义结构的重要性。
  • 在大数据集上,较快的推理器仍可受益(例如 Ebr:Carcinogenesis 由 ~700k 降至 ~100k),并且在适当的替换策略下内存使用仍可控。
(b) Mutagenesis
(b) Mutagenesis

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。