QUICK REVIEW
[论文解读] Citation Distributions in High Energy Physics
Sune Lehmann, B. Lautrup|arXiv (Cornell University)|Nov 4, 2002
Complex Network Analysis Techniques被引用 1
一句话总结
本文利用SPIRES数据库分析高能物理领域的引文分布,发现引文数量遵循幂律分布,且具有两个不同的指数:引文数少于50篇的论文α ≈ 1.2,引文数达到或超过50篇的论文α ≈ 2.3。研究证明,知名个人和机构的引文记录在统计上极不可能源于该分布的随机抽样,表明引文模式并非随机。
ABSTRACT
The probability that a given paper in the SPIRES data base has $x$ citations is well described by simple power laws, $P(x) \\propto x^{-\\alpha}$, with $\\alpha \\approx 1.2$ for $x$ less than 50 citations and $\\alpha \\approx 2.3$ for 50 or more citations. A consideration of citation distribution by subfield shows the data base to be remarkably homogeneous. We demonstrate the extreme improbability that the citation records of selected individuals and institutions have been obtained by a random draw on the resulting distribution.
研究动机与目标
- 利用SPIRES数据库表征高能物理领域引文统计分布。
- 确定高能物理各子领域之间的引文模式是否具有同质性或存在显著差异。
- 评估顶尖研究者与机构的引文记录是否可能源于对观测到的引文分布的随机抽样。
- 探究所观测到的引文模式是否反映了学术认可中潜在的非随机过程。
提出的方法
- 分析高能物理领域论文在SPIRES数据库中的引文数量。
- 将引文频率分布拟合至幂律模型 P(x) ∝ x^−α,以估计指数α。
- 将数据分为两个区间:x < 50 篇引文和 x ≥ 50 篇引文,以识别幂律指数的变化。
- 将选定个人与机构的引文记录与理论幂律分布进行比较,以评估统计显著性。
- 使用统计假设检验评估观测到的引文记录源于该分布随机抽样的不可能性。
实验结果
研究问题
- RQ1何种函数形式最能描述高能物理领域的引文分布?
- RQ2幂律指数α在不同引文数量区间内如何变化?
- RQ3高能物理领域内不同子领域之间的引文分布是否一致?
- RQ4顶尖研究者与机构的引文记录源于对整体引文分布随机抽样的可能性有多大?
主要发现
- 高能物理领域的引文数量遵循幂律分布,引文数少于50篇的论文α ≈ 1.2。
- 对于引文数达到或超过50篇的论文,幂律指数增加至α ≈ 2.3,表明频率衰减更加陡峭。
- 高能物理领域内各子领域的引文分布表现出显著的同质性,表明引文行为具有一致性。
- 选定个人与机构的引文记录在统计上极不可能源于对观测引文分布的随机抽样。
- 所观测到的引文模式表明,高能物理领域引文实践中存在系统性、非随机的影响因素。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。