Skip to main content
QUICK REVIEW

[论文解读] Linking to Data - Effect on Citation Rates in Astronomy

Edwin A. Henneken, Alberto Accomazzi|arXiv (Cornell University)|Nov 15, 2011
Astronomy and Astrophysical Research参考文献 2被引用 37
一句话总结

本研究分析了1995–2000年天文学出版物的引用率,发现与未链接在线数据的文章相比,链接到在线数据的文章在10年内引用率高出20%。利用SAO/NASA ADS的归一化引用分布,作者证明了数据链接文章具有统计上显著的引用优势,表明数据链接可增强科学影响力,并激励数据共享。

ABSTRACT

Is there a difference in citation rates between articles that were published with links to data and articles that were not? Besides being interesting from a purely academic point of view, this question is also highly relevant for the process of furthering science. Data sharing not only helps the process of verification of claims, but also the discovery of new findings in archival data. However, linking to data still is a far cry away from being a "practice", especially where it comes to authors providing these links during the writing and submission process. You need to have both a willingness and a publication mechanism in order to create such a practice. Showing that articles with links to data get higher citation rates might increase the willingness of scientists to take the extra steps of linking data sources to their publications. In this presentation we will show this is indeed the case: articles with links to data result in higher citation rates than articles without such links. The ADS is funded by NASA Grant NNX09AB39G.

研究动机与目标

  • 调查在学术文章中包含在线数据链接是否能提高其引用影响力,相较于未包含此类链接的文章。
  • 确定数据链接是否可作为研究人员公开共享数据的可衡量激励因素。
  • 评估观察到的引用优势是否源于数据链接,而非其他混杂因素(如预印本发布或学科偏好偏差)。
  • 评估数据共享在提升天文学科学影响力及促进可重复性方面的作用。
  • 提供实证证据,支持机构和文化层面推动学术出版中数据链接的激励机制。

提出的方法

  • 从四本主要天文学期刊中选取3814篇含数据链接的文章('D_d')和7218篇不含数据链接的文章('D_n'),通过共享关键词筛选以控制学科主题差异。
  • 利用SAO/NASA天体物理数据系统(ADS)提取每篇文章在发表后2年、4年和10年的引用次数。
  • 通过各组总引用数对引用次数进行归一化处理,以实现数据链接与非链接出版物之间的公平比较。
  • 采用箱线图和累积引用分布图,可视化引用积累随时间的变化模式。
  • 进行回归分析,检验两组间引用差异的统计显著性。
  • 控制了预印本可获得性及天体数据库链接(NED/SIMBAD)等混杂变量,确认两组间具有同质性。

实验结果

研究问题

  • RQ1包含在线数据链接的文章是否显著获得比无数据链接文章更高的引用率?
  • RQ2数据链接文章的引用优势是否可归因于预印本可获得性或特定学科的引用模式?
  • RQ3数据链接的存在是否与长达10年的长期引用影响力相关?
  • RQ4数据链接能否被视为科学出版中数据共享的可衡量激励因素?
  • RQ5数据中心的数据链接实践是否倾向于更易被引用的文献,还是该效应在整个数据集中保持一致?

主要发现

  • 在10年期间,含数据链接的文章平均比不含数据链接的文章多获得20%的引用次数。
  • 20%的引用次数增长在95%置信水平下具有统计显著性,经回归分析确认。
  • 该引用优势在发表后仅2年即显现,中位引用数分别为10次(含链接)和8次(不含链接)。
  • 在4年时,该效应依然存在,中位引用数分别为17次(含链接)和13次(不含链接),表明影响具有持续性。
  • 受控比较显示,两组在预印本使用率和天体数据库链接方面无显著差异,降低了混杂因素的影响。
  • 结果表明,数据链接是引用影响力的重要贡献因素,且独立于其他出版属性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。