Skip to main content
QUICK REVIEW

[论文解读] Abstract Reasoning with Distracting Features

Kecheng Zheng, Zheng-Jun Zha|arXiv (Cornell University)|Dec 2, 2019
Topic Modeling被引用 30
一句话总结

该论文提出特征鲁棒抽象推理(FRAR),一种学生-教师框架,利用强化学习优化训练轨迹,并减轻抽象推理任务中干扰特征的影响。通过引导模型在存在误导性特征的情况下学习推理模式,FRAR实现了最先进性能,在RAVEN数据集上准确率提升18.7%,在PGM数据集上提升13.3%。

ABSTRACT

Abstraction reasoning is a long-standing challenge in artificial intelligence. Recent studies suggest that many of the deep architectures that have triumphed over other domains failed to work well in abstract reasoning. In this paper, we first illustrate that one of the main challenges in such a reasoning task is the presence of distracting features, which requires the learning algorithm to leverage counterevidence and to reject any of the false hypotheses in order to learn the true patterns. We later show that carefully designed learning trajectory over different categories of training data can effectively boost learning performance by mitigating the impacts of distracting features. Inspired by this fact, we propose feature robust abstract reasoning (FRAR) model, which consists of a reinforcement learning based teacher network to determine the sequence of training and a student network for predictions. Experimental results demonstrated strong improvements over baseline algorithms and we are able to beat the state-of-the-art models by 18.7% in the RAVEN dataset and 13.3% in the PGM dataset.

研究动机与目标

  • 解决干扰特征在抽象推理任务中误导模型的挑战。
  • 通过学习拒绝错误假设并聚焦于真实推理模式,提升模型泛化能力。
  • 开发一种自适应序列化数据的训练策略,以减少干扰特征的干扰。
  • 证明课程学习式训练轨迹在存在干扰特征时能显著提升性能。
  • 验证基于强化学习的学生-教师框架在抽象推理课程学习中的有效性。

提出的方法

  • 学生网络(逻辑嵌入网络,LEN)显式枚举大规模逻辑推理模式空间,以支持抽象推理。
  • 教师网络使用强化学习,通过选择训练数据子集的顺序和比例,学习最优训练轨迹。
  • 教师模型根据学生在性能上的反馈,调整策略以最小化干扰特征的影响。
  • 训练过程采用课程学习,逐步引入复杂度和干扰程度递增的数据子集。
  • 该框架利用t-SNE可视化分析并确认了嵌入空间中推理特征与干扰特征的解耦效果。
  • 模型在RAVEN和PGM基准数据集上进行训练与评估,干扰特征设置受控。

实验结果

研究问题

  • RQ1干扰特征如何降低抽象推理模型的性能?其导致性能下降的机制是什么?
  • RQ2基于课程的训练策略,通过序列化数据子集,能否提升模型对干扰特征的鲁棒性?
  • RQ3基于强化学习的教师模型是否在抽象推理任务中优于固定或随机的训练顺序?
  • RQ4模型在学习表征空间中在多大程度上能将推理特征与干扰特征解耦?
  • RQ5所提出的FRAR框架是否能在RAVEN和PGM等标准抽象推理基准上实现最先进性能?

主要发现

  • FRAR在RAVEN数据集上达到82.1%的测试准确率,比之前最先进方法高出18.7%。
  • 在PGM数据集上,FRAR达到67.6%的准确率,较先前最先进方法提升13.3%。
  • 当通过教师模型优化训练轨迹时,模型性能显著提升,尤其在存在干扰特征时效果更明显。
  • 在无干扰特征条件下,训练顺序影响较小;但存在干扰时,最优轨迹选择带来显著性能增益。
  • t-SNE可视化证实,经教师引导的路径使模型在嵌入空间中更好地分离了推理特征与干扰特征。
  • 教师模型的强化学习策略成功学习到优先选择能最小化干扰属性影响的数据子集。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。