[論文レビュー] Reference Coverage Analysis of OpenAlex compared to Web of Science and Scopus
研究は、参照カバレッジとメタデータにおいて OpenAlex を Web of Science および Scopus と比較し、OpenAlex は参照カバレッジが同程度だが要約と OA には混在した結果、ORCID カバレッジが高い一方で著者のデディプリケーションに問題が生じる可能性がある、という結論。
OpenAlex is a promising open source of scholarly metadata, and competitor to established proprietary sources, such as the Web of Science and Scopus. As OpenAlex provides its data freely and openly, it permits researchers to perform bibliometric studies that can be reproduced in the community without licensing barriers. However, as OpenAlex is a rapidly evolving source and the data contained within is expanding and also quickly changing, the question naturally arises as to the trustworthiness of its data. In this report, we will study the reference coverage and selected metadata within each database and compare them with each other to help address this open question in bibliometrics. In our large-scale study, we demonstrate that, when restricted to a cleaned dataset of 16.8 million recent publications shared by all three databases, OpenAlex has average source reference numbers and internal coverage rates comparable to both Web of Science and Scopus. We further analyse the metadata in OpenAlex, the Web of Science and Scopus by journal, finding a similarity in the distribution of source reference counts in the Web of Science and Scopus as compared to OpenAlex. We also demonstrate that the comparison of other core metadata covered by OpenAlex shows mixed results when broken down by journal, capturing more ORCID identifiers, fewer abstracts and a similar number of Open Access status indicators per article when compared to both the Web of Science and Scopus.
研究の動機と目的
- OpenAlex の参照カバレッジが Web of Science および Scopus の共有コーパス(2015–2022)とどのように比較されるかを評価する。
- OpenAlex のメタデータカバレッジ(要約、ORCID、OA)を WoS および Scopus と比較する。
- 3 データベース間の参照数のデータ品質問題(データ重複 DOI、参照の欠損、削除された参照)を調査する。
提案手法
- 2015–2022 に公開されたアイテムの DOI が全てのデータベースで一致する共有コーパスを構築(参考文献は1996–2022)。
- 提供元レポートの参照数と自己計算参照数(総計とソース別)を用いてレコードあたりの平均参照数と内部カバレッジを計算する。
- 要約、ORCID の有無、Open Access の状況についてジャーナルごとのメタデータカバレッジを計算・比較する。
- 事前計算値と自己計算値の参照数の不整合を分析してデータ品質を評価する。
実験結果
リサーチクエスチョン
- RQ1OpenAlex の内部/参照カバレッジは、Shared Corpus(2015–2022)および 1996–2022 の参照に対して Web of Science および Scopus とどう比較されるか。
- RQ2OpenAlex における要約、ORCID の有無、および OA 状態のメタデータカバレッジは、Shared Corpus 内の専有データベースと比較してどうか。
- RQ3参照数のクロスデータベース比較に影響を与えるデータ品質問題(DOI の重複、DOI の欠落、削除された参照など)は何か。
- RQ4OpenAlex のメタデータ特性が再現性のあるボビリオメトリクスや実務での使用にどのような影響を与えるか。
主な発見
- Shared Corpus(2015–2022)に制限した場合、OpenAlex の平均参照数は Web of Science および Scopus と同程度である。
- Shared Corpus 内では OpenAlex の平均ソース参照数は 34.863(参照 1996–2022)、WoS(33.416)および Scopus(33.363)と比較可能。
- 要約カバレッジは WoS/Scopus が高く(>92%)、OpenAlex は 87%。
- ORCID カバレッジは OpenAlex が高く(少なくとも1つの ORCID を持つ割合 92%)WoS(16%)および Scopus(32%)より高い。
- Open Access カバレッジは3データベース全体で約49%程度で、OpenAlex の Unpaywall 経由のインデックス遅延がわずかに有利である。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。