Skip to main content
QUICK REVIEW

[论文解读] Open Research Knowledge Graph: Next Generation Infrastructure for Semantic Scholarly Knowledge

Mohamad Yaser Jaradeh, Allard Oelen|arXiv (Cornell University)|Jan 1, 2019
Semantic Web and Ontologies参考文献 48被引用 35
一句话总结

本文介绍了开放研究知识图谱(ORKG),这是一种下一代基础设施,通过结合众包与自动化自然语言处理的混合方法,将学术知识以机器可操作的结构化形式进行捕获。用户评估显示用户对贡献结构化研究成果表现出高度接受度和兴趣,验证了在知识图谱环境中实现可扩展、细粒度学术知识整理的可行性。

ABSTRACT

Despite improved digital access to scholarly knowledge in recent decades, scholarly communication remains exclusively document-based. In this form, scholarly knowledge is hard to process automatically. We present the first steps towards a knowledge graph based infrastructure that acquires scholarly knowledge in machine actionable form thus enabling new possibilities for scholarly knowledge curation, publication and processing. The primary contribution is to present, evaluate and discuss multi-modal scholarly knowledge acquisition, combining crowdsourced and automated techniques. We present the results of the first user evaluation of the infrastructure with the participants of a recent international conference. Results suggest that users were intrigued by the novelty of the proposed infrastructure and by the possibilities for innovative scholarly knowledge processing it could enable.

研究动机与目标

  • 通过实现机器可处理、语义丰富的学术知识表示,解决基于文档的学术交流的局限性。
  • 开发一种在研究生命周期中,特别是在知识创造时刻捕获学术知识的基础设施。
  • 通过众包知识图谱整理平台,评估用户贡献结构化研究成果的意愿及系统的可用性。
  • 将自动化自然语言处理技术与人工输入相结合,实现多模态学术知识获取。

提出的方法

  • ORKG基础设施将学术知识建模为包含问题、方法和结果等关键要素的结构化'研究贡献'。
  • 采用前端界面,允许用户通过引导式表单手动整理和标注研究贡献。
  • 集成自动化自然语言处理管道,包括来自Textrazor和MeaningCloud等工具的命名实体识别和关系抽取,以预先提取并建议内容。
  • 系统支持多模态输入,包括文本、表格和图表,以丰富知识图谱节点。
  • 一个原型界面(图5)展示了自动化文本提取与用户输入的实时集成。
  • 该基础设施支持版本控制、用户身份认证,并支持未来与纳米出版物及学术可视化工具的集成。

实验结果

研究问题

  • RQ1作者是否愿意使用专门设计的基础设施,贡献其论文中关键研究成果的结构化描述?该基础设施的用户接受度如何?
  • RQ2该基础设施能否有效整合众包与自动化技术,实现多模态学术知识获取?
  • RQ3如何将自动化信息抽取集成到用户工作流中,以支持并简化手动整理?

主要发现

  • 在会议研讨会中进行的用户评估显示,ORKG前端获得高度积极反馈,所有可用性方面评分均高于平均水平,仅‘所需指导’一项略低,表明系统可用性极高。
  • 参与者对ORKG表现出浓厚兴趣,并建议将其与数字图书馆及学术机构集成,表明其具备机构采纳潜力。
  • 实体链接的覆盖率指标显示,Falcon是前景最广阔的NLP工具,在标准测试数据集上的ζ(覆盖率)值为0.78。
  • 原型成功展示了将自动化NLP功能集成到用户工作流中的效果,例如通过高亮相关文本区域来支持输入。
  • 结果证实作者愿意贡献结构化知识,支持在大规模众包环境下进行学术知识整理的可行性。
  • 该系统具有可扩展性,支持未来增强功能,如讨论功能、版本控制,以及与纳米出版物的互操作性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。