QUICK REVIEW
[论文解读] Explaining Trained Neural Networks with Semantic Web Technologies: First Steps
Md Kamruzzaman Sarker, Ning Xie|arXiv (Cornell University)|Oct 11, 2017
Anomaly Detection Techniques and Applications参考文献 13被引用 28
一句话总结
本文提出了一种新颖的方法,通过整合结构化的语义网知识(例如RDF/OWL本体)来解释训练好的神经网络,生成人类可理解的非命题性解释。利用DL-Learner等工具以及SUMO中的背景知识,生成逻辑概念描述(例如“包含一片水域”),以解释图像分类结果,通过在仓库、市场和山脉图像数据集上的初步实验验证了其可行性。
ABSTRACT
The ever increasing prevalence of publicly available structured data on the World Wide Web enables new applications in a variety of domains. In this paper, we provide a conceptual approach that leverages such data in order to explain the input-output behavior of trained artificial neural networks. We apply existing Semantic Web technologies in order to provide an experimental proof of concept.
研究动机与目标
- 为解决黑箱神经网络中缺乏人类可解释性解释的问题,尤其是在安全关键应用中。
- 超越命题规则提取,利用RDF/OWL本体中的非命题语义知识。
- 整合外部结构化知识(例如SUMO、Wikidata),以简化并丰富神经网络行为的解释。
- 探索利用语义背景知识解释输入-输出映射关系以及内部神经元激活。
- 为使用语义网技术实现神经符号融合建立概念和实验基础。
提出的方法
- 利用现有的语义网技术,包括RDF用于知识表示,OWL用于本体建模,以编码背景知识。
- 使用DL-Learner工具从训练数据和背景知识中自动推导出逻辑概念描述(描述逻辑形式)。
- 将输入特征(例如通过目标检测识别出的图像对象)映射到SUMO等正式本体中的概念。
- 将解释表述为逻辑表达式(例如∃contains.BodyOfWater),以描述导致分类结果的语义条件。
- 通过使用正样本和负样本图像来训练解释生成器,将该方法应用于图像分类任务。
- 利用本体层次结构(例如“橡树”和“枫树”作为“树”的子类)来泛化并简化解释。
实验结果
研究问题
- RQ1结构化的语义网知识是否能够超越命题规则提取,提升神经网络预测的可解释性?
- RQ2如何从神经网络输入中自动生成非命题性、基于概念的解释(例如“包含一片水域”)?
- RQ3来自SUMO等本体的背景知识在多大程度上能够生成更简洁且更有意义的解释?
- RQ4人类监控者是否能够利用这些解释检测并纠正模型的误分类,例如遗漏关键视觉特征?
- RQ5背景知识的选择在多大程度上影响生成解释的质量和准确性?
主要发现
- 该方法成功为山脉图像生成了语义上合理的解释,例如“包含一片水域”,且与视觉内容一致。
- 解释如“既不包含家具也不包含工业用品”能够正确区分工作间与仓库,即使目标检测不完整。
- 系统识别出模型在仓库图像中遗漏了叉车司机,表明该方法具有支持人机协同纠错的潜力。
- 使用本体泛化(例如将“树”作为“橡树”和“枫树”的超类)降低了解释复杂度,支持了背景知识可简化解释的假设。
- 在实验中,解释与视觉特征一致(例如山脉图像中存在河流/湖泊),验证了该方法与输入数据的一致性。
- 该方法展示了利用现有语义网技术栈和DL-Learner等工具生成非命题性、人类可读解释的可行性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。