Skip to main content
QUICK REVIEW

[论文解读] OpenAlex Snapshot

Jason Priem, Heather Piwowar|arXiv (Cornell University)|May 4, 2022
Topic Modeling参考文献 6被引用 271
一句话总结

OpenAlex 是一个完全开放的科学知识图谱,取代 MAG,通过 GUI、数据转储和 REST API 为数百万个论文、作者、刊物、机构和概念提供元数据。

ABSTRACT

OpenAlex is an open, comprehensive index of scolarly papers, citations, authors, institutions, and journals. Available through API and UI as well (at openalex.org), this record refers to the full data snapshot. When citing OpenAlex, don't use this record. Instead, use: Priem, J., Piwowar, H., & Orr, R. (2022). OpenAlex: A fully-open index of scholarly works, authors, venues, institutions, and concepts. ArXiv. https://arxiv.org/abs/2205.01833 This record is intended for long-term persistence but because the OpenAlex snapshot updates every month, it is better to download the current version directly from AWS. Information on how to download the entire data snapshot for OpenAlex can be found at: https://docs.openalex.org/download-all-data/openalex-snapshot

研究动机与目标

  • 阐明需要一个开放、全面的学术知识图谱来替代已停止的 MAG。
  • 描述 OpenAlex 的结构和规模,包括作品、作者、刊物、机构和概念。
  • 突出 OpenAlex 如何通过多种交付模式可访问和使用,以及其持续的发展轨迹。

提出的方法

  • 将 OpenAlex 知识图谱定义为一个对学术元数据完全开放的资源。
  • 枚举组成部分:作品、作者、刊物、机构,以及通过分类器连接的 Wikidata 概念。
  • 提供访问方式:网页 GUI、完整数据转储,以及高容量 REST API。
  • 讨论当前的局限性以及在引用准确性、实体解析/去重方面的计划改进。

实验结果

研究问题

  • RQ1OpenAlex 知识图谱的核心组件和规模是什么(作品、作者、刊物、机构、概念)?
  • RQ2研究人员如何访问和使用 OpenAlex(GUI、数据转储、API),目前有哪些局限性?
  • RQ3在引用准确性、作者/机构解析与去重方面,OpenAlex 计划有哪些改进?

主要发现

  • OpenAlex 包含 2.09 亿条作品元数据(期刊文章、书籍等)。
  • 它包含 2013 million 去歧义的作者。
  • 它编目 124 千个刊物和 109 千个机构。
  • 它通过一个自动化的分层多标签分类器将 65 千个 Wikidata 概念链接到作品。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。