[论文解读] Towards Cognitive AI Systems: a Survey and Prospective on Neuro-Symbolic AI
本论文综述神经符号 AI(NSAI),分析系统级工作负载和计算算子,给出三种 NSAI 模型的性能画像,并概述认知 AI 系统的挑战与未来研究方向。
The remarkable advancements in artificial intelligence (AI), primarily driven by deep neural networks, have significantly impacted various aspects of our lives. However, the current challenges surrounding unsustainable computational trajectories, limited robustness, and a lack of explainability call for the development of next-generation AI systems. Neuro-symbolic AI (NSAI) emerges as a promising paradigm, fusing neural, symbolic, and probabilistic approaches to enhance interpretability, robustness, and trustworthiness while facilitating learning from much less data. Recent NSAI systems have demonstrated great potential in collaborative human-AI scenarios with reasoning and cognitive capabilities. In this paper, we provide a systematic review of recent progress in NSAI and analyze the performance characteristics and computational operators of NSAI models. Furthermore, we discuss the challenges and potential future directions of NSAI from both system and architectural perspectives.
研究动机与目标
- 推动对高效性、鲁棒性和可解释性超越纯深度学习的下一代 AI 的需求。
- 系统性地对 NSAI 算法及其对神经、符号和概率组件的整合进行分类。
- 对代表性 NSAI 模型的运行时特性和计算算子进行性能画像,以识别瓶颈。
- 讨论数据集、统一框架、基准测试以及用于 NSAI 的认知硬件等方面的挑战与方向。
提出的方法
- 将 NSAI 算法分成五大范式,灵感来自 Ka͏utz 的分类法:Symbolic[Neuro]、Neuro|Symbolic、Neuro:SymbolicrightarrowNeuro、Neuro[Symbolic]、以及 Neuro[Symbolic](LTN/神经张量网络变体)。
- 将底层操作映射到向量表示与非向量表示,并为每种范式列举示例系统(如 AlphaGo/AlphaZero、NVSA、NeuPSL、NSVQA、LNNs、LTNs)。
- 在 CPU/GPU 上使用 PyTorch Profiler 对三种代表性 NSAI 模型(LNN、LTN、NVSA)进行档案分析,以获得逐函数运行时。
- 将计算算子分为六类(卷积、矩阵乘法、向量/逐元素运算、数据变换、数据移动、其他)以分析神经工作负载与符号工作负载的分布。
- 分析运行时分解以识别瓶颈及数据流对 NSAI 推理管线的影响。
实验结果
研究问题
- RQ1主要的 NSAI 范式有哪些,它们如何整合神经、符号与概率组件?
- RQ2在常见硬件上,代表性 NSAI 模型的运行时特性与瓶颈是什么?
- RQ3神经与符号工作负载如何共同影响总延迟,随着更大 NSAI 工作负载的可扩展性挑战为何而来?
主要发现
- 符号工作负载在 NSAI 模型中可能主导延迟,神经 vs 符号组件的份额为 LNN(54.6%)、LTN(45.4%)以及 NVSA(7.9%)。
- NVSA 展现出强烈的符号瓶颈(约 92.1% 的符号/总运行时来自于逐步规则检测的推理过程)。
- 神经工作负载主要由 MatMul 和激活操作驱动,而 NVSA 由于感知骨干而严重依赖于 MatMul 和卷积。
- 在不同测试规模下,总的 NSAI 运行时呈二次增长,表明对更大推理任务的可扩展性存在瓶颈。
- 符号组件呈现复杂的控制流和数据移动挑战,表明架构和数据流优化可能带来收益。
- 本文指出需要统一的神经-符号-概率框架、基准标准,以及为 NSAI 工作负载定制的认知硬件。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。