[論文レビュー] OpenAlex Snapshot
OpenAlex は MAG を置換する完全に公開された科学知識グラフであり、GUI、データダンプ、REST API を通じて数百万の研究作品、著者、会場、機関、概念のメタデータを提供します。
OpenAlex is an open, comprehensive index of scolarly papers, citations, authors, institutions, and journals. Available through API and UI as well (at openalex.org), this record refers to the full data snapshot. When citing OpenAlex, don't use this record. Instead, use: Priem, J., Piwowar, H., & Orr, R. (2022). OpenAlex: A fully-open index of scholarly works, authors, venues, institutions, and concepts. ArXiv. https://arxiv.org/abs/2205.01833 This record is intended for long-term persistence but because the OpenAlex snapshot updates every month, it is better to download the current version directly from AWS. Information on how to download the entire data snapshot for OpenAlex can be found at: https://docs.openalex.org/download-all-data/openalex-snapshot
研究の動機と目的
- 廃止された MAG を置き換えるための、公開され、包括的な学術知識グラフの必要性を動機付ける。
- OpenAlex の構造と規模を、研究作品、著者、会場、機関、概念を含めて説明する。
- 複数の提供形態を通じたアクセスと利用可能性、および開発の継続的な方向性を強調する。
提案手法
- OpenAlex 知識グラフを、学術メタデータの完全に公開されたリソースとして定義する。
- 構成要素を列挙する:works、authors、venues、institutions、そして分類子を介してリンクされた Wikidata concepts。
- アクセス形態を提供する:Web GUI、完全なデータダンプ、そして大容量 REST API。
- 引用精度とエンティティの解析/重複除去における現状の制限と計画されている改善点を議論する。
実験結果
リサーチクエスチョン
- RQ1OpenAlex 知識グラフのコア要素と規模(works、authors、venues、institutions、concepts)は何か?
- RQ2研究者はどのように OpenAlex(GUI、データダンプ、API)にアクセスし、利用できるか、現状の制限は何か?
- RQ3OpenAlex における引用精度、著者/機関の解析、および重複排除の改善計画は何か?
主な発見
- OpenAlex には 209 million works(ジャーナル論文、書籍等)のメタデータが含まれる。
- それは 2013 million disambiguated authors を含む。
- それは 124 thousand venues と 109 thousand institutions をカタログ化している。
- それは自動的な階層的マルチタグ分類器を介して 65 thousand Wikidata concepts を作品にリンクさせている。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。