Skip to main content
QUICK REVIEW

[論文レビュー] Linking to Data - Effect on Citation Rates in Astronomy

Edwin A. Henneken, Alberto Accomazzi|arXiv (Cornell University)|Nov 15, 2011
Astronomy and Astrophysical Research参考文献 2被引用数 37
ひとこと要約

本研究は1995–2000年の天文学分野の論文における引用件数を分析し、オンラインデータにリンクしている論文は、そうでない論文よりも10年間で平均20%多い引用件数を記録していることを発見した。SAO/NASA ADSの正規化引用分布を用いて、データリンク付き論文に統計的に有意な引用優位性があることを示しており、データリンクが科学的インパクトを高め、データ共有を促すインcentiveとなる可能性を示唆している。

ABSTRACT

Is there a difference in citation rates between articles that were published with links to data and articles that were not? Besides being interesting from a purely academic point of view, this question is also highly relevant for the process of furthering science. Data sharing not only helps the process of verification of claims, but also the discovery of new findings in archival data. However, linking to data still is a far cry away from being a "practice", especially where it comes to authors providing these links during the writing and submission process. You need to have both a willingness and a publication mechanism in order to create such a practice. Showing that articles with links to data get higher citation rates might increase the willingness of scientists to take the extra steps of linking data sources to their publications. In this presentation we will show this is indeed the case: articles with links to data result in higher citation rates than articles without such links. The ADS is funded by NASA Grant NNX09AB39G.

研究の動機と目的

  • データリンク付き論文が、データリンクなしの論文よりも引用インパクトが高いかを調査すること。
  • データリンクが研究者がデータをオープンに共有する動機づけとして測定可能かどうかを特定すること。
  • 観察された引用優位性が、e-printの有無や分野特有の引用パターンといった他の混同要因によるものかどうかを評価すること。
  • データ共有が天文学分野における科学的インパクトの向上と再現可能性の促進に果たす役割を評価すること。
  • 学術出版におけるデータリンクの促進に向けた制度的・文化的インcentiveを裏付ける実証的証拠を提供すること。

提案手法

  • 1995–2000年の4つの主要な天文学ジャーナルから、データリンクあり('D_d')の論文3814件と、データリンクなし('D_n')の論文7218件を抽出。共通のキーワードでフィルタリングし、分野の偏りを制御した。
  • SAO/NASA Astrophysics Data System (ADS)を用いて、各論文の発表後2年、4年、10年における引用件数を抽出した。
  • 各グループの合計引用件数で正規化することで、データリンクあり・なしの論文間での公平な比較を可能にした。
  • 箱ひげ図と累積引用分布を用いて、時間経過に伴う引用件数の蓄積パターンを可視化した。
  • 2群間の引用差の統計的有意性を検証するための回帰分析を実施した。
  • e-printの利用状況やオブジェクトデータベース(NED/SIMBAD)へのリンクなど、混同要因を制御し、両グループ間の同質性を確認した。

実験結果

リサーチクエスチョン

  • RQ1オンラインデータにリンクしている論文は、リンクがない論文よりも著しく高い引用件数を記録するか?
  • RQ2データリンク付き論文の引用優位性は、e-printの有無や分野固有の引用パターンといった要因に起因するか?
  • RQ3データリンクの有無が10年間の引用インパクトに相関するか?
  • RQ4データリンクは科学的出版におけるデータ共有の測定可能なインcentiveと見なせるか?
  • RQ5データセンターのデータリンク実務は、より引用されやすい論文に偏っているのか、それともデータセット全体にわたって一貫した効果を示すのか?

主な発見

  • データリンク付き論文は、10年間の平均で、リンクなしの論文よりも20%多い引用件数を記録した。
  • 引用件数の20%増加は、回帰分析により95%信頼水準で統計的に有意であった。
  • 引用優位性は発表後2年目から顕著で、中位値はリンクありで10件、リンクなしで8件であった。
  • 4年後も効果は維持されており、中位値はリンクありで17件、リンクなしで13件であった。これは持続的なインパクトを示している。
  • 制御された比較により、両グループ間でe-printの利用状況やオブジェクトデータベースへのリンクに有意差は認められず、混同要因の影響が低減された。
  • 結果から、データリンクは他の出版属性とは独立して、引用インパクトに意味のある貢献をしていることが示唆された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。