[论文解读] Who is the best connected scientist? A study of scientific coauthorship networks
本文基于物理学、生物医学研究和计算机科学领域的书目数据库构建并分析了科学合作网络,以研究协作模式。通过使用介数、接近度以及一种基于共同发表论文和合作者多样性的新型加权关系强度度量等网络指标,识别出连接度最高的科学家,结果表明:在理论物理领域中,高产且拥有众多紧密合作的科学家在连接度上表现最佳。
Using data from computer databases of scientific papers in physics, biomedical research, and computer science, we have constructed networks of collaboration between scientists in each of these disciplines. In these networks two scientists are considered connected if they have coauthored one or more papers together. We have studied many statistical properties of our networks, including numbers of papers written by authors, numbers of authors per paper, numbers of collaborators that scientists have, typical distance through the network from one scientist to another, and a variety of measures of connectedness within a network, such as closeness and betweenness. We further argue that simple networks such as these cannot capture the variation in the strength of collaborative ties and propose a measure of this strength based on the number of papers coauthored by pairs of scientists, and the number of other scientists with whom they coauthored those papers. Using a selection of our results, we suggest a variety of possible ways to answer the question "Who is the best connected scientist?"
研究动机与目标
- 利用书目数据库中的实证数据,研究多个学科中科学协作网络的结构特性。
- 通过使用大规模、客观且可靠的书目计量数据,而非主观的调查反馈,弥补传统社会网络研究的局限性。
- 开发并应用一种加权协作强度度量方法,同时考虑联合发表论文的数量与合作者的多样性。
- 利用介数和接近度等网络中心性指标,特别是加权网络中的指标,识别出最‘连接’的科学家。
- 展示书目计量数据库作为网络科学和社交系统物理启发分析的丰富、可扩展数据源的实用性。
提出的方法
- 从四个数据库(Los Alamos e-Print Archive、MEDLINE、SPIRES 和 NCSTRL)构建了无权合作网络,涵盖 1995–1999 年间发表的论文。
- 应用一种新型 O(N³) 算法计算介数中心性,其速度比以往方法快一个数量级。
- 提出一种基于联合发表论文数量及这些论文中其他合作者数量的加权协作关系强度度量方法。
- 利用加权网络计算加权接近度中心性,识别出到其他科学家平均路径长度最短的科学家。
- 分析网络属性,如平均路径长度、度分布以及‘汇聚’效应(即大多数科学家之间的最短路径仅通过一到两个中介)。
- 应用统计物理技术,包括随机图模型和标度分析,以解释网络结构和小世界特性。
实验结果
研究问题
- RQ1物理学、生物医学研究和计算机科学领域中的科学合作网络具有哪些统计特性?
- RQ2介数和接近度中心性等网络指标在识别这些网络中连接度最高的科学家方面表现如何?
- RQ3传统无权网络在多大程度上无法真实反映科学家之间协作关系的强度?
- RQ4将基于共同发表频率和合作者多样性的加权协作强度度量方法纳入后,对识别出最连接的科学家有何影响?
- RQ5高产且高度连接的科学家在塑造科学协作网络的整体连通性与小世界结构方面发挥着何种作用?
主要发现
- 网络中科学家之间的平均路径长度较小,且随网络规模呈对数缩放,表明其具有‘小世界’结构,与随机图模型一致。
- 每位科学家合作人数的分布呈幂律形式,尽管可能存在因研究时间窗口有限而引起的偏差。
- 观察到‘汇聚’效应:对于大多数科学家对,其大多数最短路径仅通过一到两个合作者,表明协作通过少数核心枢纽传播。
- 介数中心性高的科学家——尤其是那些具有频繁合作、众多合作者的科学家——在网路中最为中心。
- 加权协作关系强度度量成功捕捉了科学关系强度的差异,表明拥有大量联合论文和多样化合作者群体的科学家更具中心性。
- 理论物理学家,特别是那些高产且与其它高度连接的科学家有紧密联系的,被识别为网络中连接度最高的科学家,一个显著的例子是一位在网路中具有高介数和接近度的理论物理学家。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。