Skip to main content
QUICK REVIEW

[논문 리뷰] Linking to Data - Effect on Citation Rates in Astronomy

Edwin A. Henneken, Alberto Accomazzi|arXiv (Cornell University)|2011. 11. 15.
Astronomy and Astrophysical Research참고 문헌 2인용 수 37
한 줄 요약

이 연구는 1995–2000년 간의 천문학 논문에서 인용률을 분석하여, 온라인 데이터에 링크가 되어 있는 논문이 링크가 없는 논문보다 10년 간 평균 20% 더 많은 인용을 받는다는 것을 발견하였다. SAO/NASA ADS의 정규화된 인용 분포를 사용하여 저자들은 데이터 링크가 있는 논문이 통계적으로 유의미한 인용 우위를 점유하고 있음을 입증하였으며, 이는 데이터 링크가 과학적 영향력을 증가시키고 데이터 공유를 유도하는 데 기여한다는 것을 시사한다.

ABSTRACT

Is there a difference in citation rates between articles that were published with links to data and articles that were not? Besides being interesting from a purely academic point of view, this question is also highly relevant for the process of furthering science. Data sharing not only helps the process of verification of claims, but also the discovery of new findings in archival data. However, linking to data still is a far cry away from being a "practice", especially where it comes to authors providing these links during the writing and submission process. You need to have both a willingness and a publication mechanism in order to create such a practice. Showing that articles with links to data get higher citation rates might increase the willingness of scientists to take the extra steps of linking data sources to their publications. In this presentation we will show this is indeed the case: articles with links to data result in higher citation rates than articles without such links. The ADS is funded by NASA Grant NNX09AB39G.

연구 동기 및 목표

  • 온라인 데이터에 링크가 포함된 논문이 링크가 없는 논문보다 인용 영향력이 더 큰지 조사하기.
  • 데이터 링크가 연구자들이 데이터를 개방적으로 공유하도록 유도하는 측정 가능한 동기로 작용하는지 확인하기.
  • 관찰된 인용 우위가 데이터 링크 때문인지, 또는 전자인쇄(e-printing)나 주제별 편향과 같은 기타 혼란 변수 때문인지 평가하기.
  • 데이터 공유가 천문학 분야에서 과학적 영향력을 높이고 재현 가능성을 증진하는 데 어떤 역할을 하는지 평가하기.
  • 기관 및 문화적 인centive를 장려하기 위한 실증적 증거를 제공하기.

제안 방법

  • 1995–2000년 동안의 네 개의 주요 천문학 저널에서 데이터 링크가 있는 논문 3814편('D_d')과 없는 논문 7218편('D_n')을 선별하였으며, 주제를 통제하기 위해 공통 키워드를 기준으로 필터링하였다.
  • 각 논문의 2년, 4년, 10년 후 인용 수를 SAO/NASA 고도학적 데이터 시스템(ADS)을 통해 추출하였다.
  • 각 집합의 총 인용 수를 기준으로 인용 수를 정규화하여 데이터 링크가 있는 논문과 없는 논문 간의 공정한 비교를 가능하게 하였다.
  • 박스 플롯과 누적 인용 분포를 사용하여 시간에 따른 인용 축적 패턴을 시각화하였다.
  • 두 그룹 간의 인용 수 차이가 통계적으로 유의미한지 확인하기 위해 회귀 분석을 실시하였다.
  • 전자인쇄 가능 여부와 객체 데이터베이스 링크(NED/SIMBAD)와 같은 혼란 변수를 통제하여 두 그룹 간의 동질성을 확인하였다.

실험 결과

연구 질문

  • RQ1온라인 데이터에 링크가 포함된 논문이 링크가 없는 논문보다 유의미하게 더 높은 인용률을 기록하는가?
  • RQ2데이터 링크가 있는 논문의 인용 우위가 전자인쇄 가능성이나 주제별 인용 패턴과 같은 요인 때문인가?
  • RQ3데이터 링크의 존재가 10년 간의 장기적 인용 영향력과 관련이 있는가?
  • RQ4데이터 링크가 과학적 출판에서 데이터 공유를 위한 측정 가능한 동기로 간주될 수 있는가?
  • RQ5데이터 센터의 데이터 링크 실천 방식이 더 인용 가능한 논문들에 대해 편향되어 있는가, 아니면 데이터셋 전반에 걸쳐 일관된 효과를 보이는가?

주요 결과

  • 데이터 링크가 있는 논문은 10년 간 평균적으로 링크가 없는 논문보다 20% 더 많은 인용을 확보하였다.
  • 20%의 인용 수 증가는 95% 신뢰수준에서 통계적으로 유의미하며, 회귀 분 析를 통해 확인되었다.
  • 인용 우위는 출판 후 2년 만에 이미 나타났으며, 중앙값은 링크가 있는 논문이 10건, 없는 논문이 8건이었다.
  • 4년 후에도 효과가 유지되었으며, 중앙값은 링크가 있는 논문이 17건, 없는 논문이 13건이었고, 이는 지속적인 영향을 의미한다.
  • 통제된 비교를 통해 두 그룹 간 전자인쇄 사용률이나 객체 데이터베이스 링크에 유의미한 차이가 없음을 확인하여 혼란 변수의 영향을 줄였다.
  • 결과는 데이터 링크가 다른 출판 속성과 독립적으로 인용 영향력에 의미 있는 기여를 한다고 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.