Skip to main content
QUICK REVIEW

[논문 리뷰] Who is the best connected scientist? A study of scientific coauthorship networks

M. E. J. Newman|RePEc: Research Papers in Economics|2000. 11. 08.
Complex Network Analysis Techniques인용 수 54
한 줄 요약

이 논문은 물리학, 생물의학 연구, 컴퓨터 과학 분야의 문헌 기반 데이터베이스로부터 과학적 공동저자 네트워크를 구축하고 분석하여 협업 패턴을 연구한다. 네트워크 지표인 중간성(median), 밀도성(closeness), 그리고 공동 논문과 공동저자 다양성을 기반으로 한 새로운 가중치를 적용한 연결 강도 측정법을 사용하여 연결성이 가장 높은 과학자를 규명한다. 그 결과, 특히 이론물리학 분야에서 활발하고 다수의 협업을 맺고 있는 초록성과 높은 생산성을 지닌 저자들이 네트워크에서 가장 중심적인 위치를 차지하는 것으로 나타났다.

ABSTRACT

Using data from computer databases of scientific papers in physics, biomedical research, and computer science, we have constructed networks of collaboration between scientists in each of these disciplines. In these networks two scientists are considered connected if they have coauthored one or more papers together. We have studied many statistical properties of our networks, including numbers of papers written by authors, numbers of authors per paper, numbers of collaborators that scientists have, typical distance through the network from one scientist to another, and a variety of measures of connectedness within a network, such as closeness and betweenness. We further argue that simple networks such as these cannot capture the variation in the strength of collaborative ties and propose a measure of this strength based on the number of papers coauthored by pairs of scientists, and the number of other scientists with whom they coauthored those papers. Using a selection of our results, we suggest a variety of possible ways to answer the question "Who is the best connected scientist?"

연구 동기 및 목표

  • 문헌 기반 데이터베이스에서의 실증적 데이터를 활용하여 물리학, 생물의학 연구, 컴퓨터 과학 등 다양한 분야의 과학적 협업 네트워크의 구조적 특성을 조사한다.
  • 기존의 사회망 연구에서의 한계를 보완하기 위해 주관적인 설문 조사 결과 대신 대규모이고 객관적이며 신뢰할 수 있는 문헌정보학적 데이터를 활용한다.
  • 공동 논문 수와 공동저자 다양성을 모두 고려한 가중치를 적용한 협업 강도 측정법을 개발하고 적용한다.
  • 중간성과 밀도성과 같은 네트워크 중심성 지표를 사용하여 가중치가 적용된 네트워크에 초점을 맞춰 가장 '연결성이 높은' 과학자를 규명한다.
  • 문헌정보학적 데이터베이스가 네트워크 과학 및 사회 시스템의 물리학 기반 분석에 있어 풍부하고 확장 가능한 데이터 원천임을 입증한다.

제안 방법

  • 1995~1999년 기간의 논문을 포함하는 네 개의 데이터베이스(Los Alamos e-Print Archive, MEDLINE, SPIRES, NCSTRL)에서 무가중치 공동저자 네트워크를 구축하였다.
  • 기존 방법보다 약 10배 빠른 O(N³) 알고리즘을 사용하여 중간성 중심성 지표를 계산하였다.
  • 공동 논문 수와 해당 논문에 참여한 다른 공동저자 수를 기반으로 한 새로운 가중치를 적용한 협업 관계 강도 측정법을 제안하였다.
  • 가중치가 적용된 네트워크를 사용하여 가중치가 적용된 밀도성 중심성 지표를 계산하였으며, 다른 과학자들과의 평균 거리가 가장 짧은 과학자를 규명하였다.
  • 평균 경로 길이, 차수 분포, 그리고 대부분의 경로가 단 한두 명의 중개자만을 거치는 '집약 효과'(funneling)와 같은 네트워크 특성을 분석하였다.
  • 무작위 그래프 모델과 척도 분석 기법을 포함한 통계물리학 기법을 적용하여 네트워크의 구조적 특성과 소월드 성질을 해석하였다.

실험 결과

연구 질문

  • RQ1물리학, 생물의학 연구, 컴퓨터 과학 분야의 과학적 공동저자 네트워크의 통계적 특성은 무엇인가?
  • RQ2중간성과 밀도성 중심성과 같은 네트워크 지표는 이러한 네트워크에서 가장 연결성이 높은 과학자를 어떻게 규명하는가?
  • RQ3기존의 무가중치 네트워크 모델은 과학자 간 협업 관계의 진정된 강도를 얼마나 정확히 반영하지 못하는가?
  • RQ4공동 논문 빈도와 공동저자 다양성을 기반으로 한 가중치를 적용한 협업 강도 측정법을 도입할 경우, 가장 연결성이 높은 과학자를 규명하는 데 어떤 영향을 미치는가?
  • RQ5높은 생산성과 높은 연결성을 지닌 과학자들은 과학적 협업 네트워크의 전체적인 연결성과 소월드 구조 형성에 어떤 역할을 하는가?

주요 결과

  • 네트워크의 과학자 간 평균 경로 길이는 네트워크 크기에 대해 로그 스케일링되며, 이는 랜덤 그래프 모델과 일치하는 '소월드' 구조임을 시사한다.
  • 과학자 한 명이 협업하는 사람 수의 분포는 파워 라이크 형태를 띠지만, 연구 기간이 유한한 탓에 일부 편차가 발생할 수 있다.
  • '집약 효과'가 관찰된다: 대부분의 과학자 쌍 간 최단 경로는 단 한두 명의 중개자만을 거치며, 이는 협업이 몇몇 중심 허브를 통해 확산됨을 의미한다.
  • 높은 중간성 중심성을 지닌 과학자들—특히 빈번한 협업과 다수의 공동저자를 보유한 과학자들이 네트워크에서 가장 중심적인 위치를 차지한다.
  • 가중치가 적용된 협업 관계 강도 측정법은 과학적 유대의 강도 변화를 성공적으로 반영하며, 많은 공동 논문과 다양한 공동저자 그룹을 가진 과학자들이 더 중심에 가까이 위치해 있음을 보여준다.
  • 이론물리학자들—특히 높은 논문 생산성과 다른 중심 과학자들과의 강력한 유대를 가진 이들이 네트워크에서 가장 연결성이 높은 과학자로 규명되었으며, 뚜렷한 사례로 중간성과 밀도성 중심성이 모두 높은 이론물리학자가 존재한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.