Skip to main content
QUICK REVIEW

[论文解读] FASTER Recurrent Networks for Video Classification.

Linchao Zhu, Laura Sevilla-Lara|arXiv (Cornell University)|Jun 10, 2019
Human Pose and Action Recognition被引用 4
一句话总结

本文介绍了LectureBank,一个包含1,352份NLP课程讲义文件及208个手动标注的先修关系的语料库,旨在支持课程概念依赖关系的学习。通过基于嵌入的方法以及神经网络/图神经网络模型,该研究展示了在先修关系预测上的改进,支持课程设计和阅读材料生成等应用。

ABSTRACT

Recent years have witnessed the rising popularity of Natural Language Processing (NLP) and related fields such as Artificial Intelligence (AI) and Machine Learning (ML). Many online courses and resources are available even for those without a strong background in the field. Often the student is curious about a specific topic but does not quite know where to begin studying. To answer the question of “what should one learn first,”we apply an embedding-based method to learn prerequisite relations for course concepts in the domain of NLP. We introduce LectureBank, a dataset containing 1,352 English lecture files collected from university courses which are each classified according to an existing taxonomy as well as 208 manually-labeled prerequisite relation topics, which is publicly available 1. The dataset will be useful for educational purposes such as lecture preparation and organization as well as applications such as reading list generation. Additionally, we experiment with neural graph-based networks and non-neural classifiers to learn these prerequisite relations from our dataset.

研究动机与目标

  • 为解决识别NLP课程概念之间先修关系的挑战,以构建有效的学习路径。
  • 创建一个公开可用、高质量的讲义文件语料库,其中标注了先修关系,以支持教育人工智能应用。
  • 评估神经网络与非神经网络模型在从讲义内容和分类体系中学习先修结构方面的表现。
  • 通过学习到的概念依赖关系,支持阅读材料生成和讲义组织等教育应用。

提出的方法

  • 作者从大学NLP课程中收集了1,352份英文讲义文件,并使用现有分类体系对它们进行分类。
  • 人工标注了208个课程概念之间的先修关系,以构建LectureBank语料库。
  • 从讲义文本中学习概念嵌入,以在共享向量空间中表示课程主题。
  • 训练基于神经网络的图模型和非神经分类器,以从嵌入表示和分类体系结构中预测先修关系。
  • 利用该语料库评估模型在学习和预测先修依赖关系方面的性能。
  • 该方法结合了文本内容与分类体系结构信息,以提升关系预测的准确性。

实验结果

研究问题

  • RQ1基于嵌入的方法在学习NLP课程概念之间先修关系方面的有效性如何?
  • RQ2与非神经网络分类器相比,神经图模型在预测先修依赖关系方面的表现如何?
  • RQ3讲义内容与分类体系结构在联合提升先修关系预测方面能达到多大程度的改进?
  • RQ4LectureBank语料库在下游教育应用(如阅读材料生成)中的实用性如何?

主要发现

  • LectureBank语料库包含1,352份讲义文件和208个手动标注的先修关系,可供研究公开使用。
  • 基于嵌入的方法能有效捕捉NLP课程概念之间的语义与结构依赖关系。
  • 基于神经网络的图模型在使用该语料库预测先修关系方面优于非神经网络分类器。
  • 该语料库通过建模课程概念依赖关系,支持实际应用如课程设计和阅读材料生成。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。