Skip to main content
QUICK REVIEW

[논문 리뷰] OpenAlex Snapshot

Jason Priem, Heather Piwowar|arXiv (Cornell University)|2022. 05. 04.
Topic Modeling참고 문헌 6인용 수 271
한 줄 요약

OpenAlex는 MAG를 대체하는 완전한 오픈 과학 지식 그래프로, GUI, 데이터 덤프, 및 REST API를 통해 수백만 개의 작업, 저자, 장소, 기관, 및 개념에 대한 메타데이터를 제공합니다.

ABSTRACT

OpenAlex is an open, comprehensive index of scolarly papers, citations, authors, institutions, and journals. Available through API and UI as well (at openalex.org), this record refers to the full data snapshot. When citing OpenAlex, don't use this record. Instead, use: Priem, J., Piwowar, H., & Orr, R. (2022). OpenAlex: A fully-open index of scholarly works, authors, venues, institutions, and concepts. ArXiv. https://arxiv.org/abs/2205.01833 This record is intended for long-term persistence but because the OpenAlex snapshot updates every month, it is better to download the current version directly from AWS. Information on how to download the entire data snapshot for OpenAlex can be found at: https://docs.openalex.org/download-all-data/openalex-snapshot

연구 동기 및 목표

  • 대체로 중단된 MAG를 대체하기 위한 개방적이고 포괄적인 학술 지식 그래프의 필요성을 동기화한다.
  • 작업, 저자, 장소, 기관, 및 개념을 포함하는 OpenAlex의 구조와 규모를 설명한다.
  • 다양한 전달 방식으로 접근 가능하고 사용 가능한 OpenAlex의 현 접근성과 개발 경로를 강조한다.

제안 방법

  • OpenAlex 지식 그래프를 학술 메타데이터를 위한 완전한 자원으로 정의한다.
  • 구성 요소를 열거한다: works, authors, venues, institutions, and Wikidata concepts linked via a classifier.
  • 접근 방식 제공: 웹 GUI, 전체 데이터 덤프, 그리고 고용량 REST API.
  • 인용 정확도 및 엔터티 파싱/중복 제거의 현재 한계와 향후 개선 계획에 대해 논의한다.

실험 결과

연구 질문

  • RQ1OpenAlex 지식 그래프의 핵심 구성 요소와 규모는 무엇인가(works, authors, venues, institutions, concepts)?
  • RQ2연구자들이 OpenAlex에 어떻게 접근하고 사용할 수 있는가(GUI, 데이터 덤프, API) 및 현재 한계는 무엇인가?
  • RQ3OpenAlex에서 인용 정확도, 저자/기관 파싱, 중복 제거에 대해 계획된 개선은 무엇인가?

주요 결과

  • OpenAlex에는 209 million works 메타데이터가 포함되어 있다.
  • 2013 million disambiguated authors가 포함되어 있다.
  • 124 thousand venues와 109 thousand institutions를 카탈로그한다.
  • 65 thousand Wikidata concepts를 자동화된 계층적 다중 태그 분류기를 통해 works에 연결한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.