[论文解读] Information Diffusion in Computer Science Citation Networks
本研究通过分析引用模式——特别是针对本学术社区内文献及近期文献的引用——来探讨计算机科学引文网络中的信息扩散机制,研究发现:虽然引用本社区内文献和近期文献会略微提升文章的后续引用次数,但这种效应在高影响力论文中会减弱,表明跨社区引用可能推动高影响力创新。
The paper citation network is a traditional social medium for the exchange of ideas and knowledge. In this paper we view citation networks from the perspective of information diffusion. We study the structural features of the information paths through the citation networks of publications in computer science, and analyze the impact of various citation choices on the subsequent impact of the article. We find that citing recent papers and papers within the same scholarly community garners a slightly larger number of citations on average. However, this correlation is weaker among well-cited papers implying that for high impact work citing within one's field is of lesser importance. We also study differences in information flow for specific subsets of citation networks: books versus conference and journal articles, different areas of computer science, and different time periods.
研究动机与目标
- 理解引文网络的结构特征如何影响计算机科学中的信息扩散。
- 探究引用选择(如引用本学术社区内文献或近期出版物)对被引文章后续引用影响力的影响。
- 比较计算机科学不同子领域、出版类型(如图书与论文)以及不同时期的信息流动模式。
- 评估跨社区引用是否更可能带来高影响力出版物,尤其是在高被引作品中。
- 探讨社区结构和引用时间间隔是否影响学术成果的可见性和影响力。
提出的方法
- 从两个大型数据集(ACM Digital Library 和 CiteSeer)构建了有向且带时间戳的引文网络,其中节点代表文献,边代表引用关系。
- 根据研究领域为文献分配社区标签,以分析社区内与跨社区的引用模式。
- 使用被引文献的出度(即后续引用次数)衡量引用影响力,并进行归一化处理以实现不同时期之间的比较。
- 计算引用时间跨度(被引文献与引用文献发表时间的间隔)与归一化出度之间的皮尔逊相关系数,以评估时间因素的影响。
- 按时间周期和研究领域对引用数据进行分组,分析不同时期和子领域中引用行为与影响力的趋势。
- 比较图书(参考文献列表更长)与期刊论文及会议论文的引用模式,以评估其在引用影响力动态上的差异。
实验结果
研究问题
- RQ1引用本学术社区内的文献是否会导致被引文章获得更高的后续引用次数?
- RQ2引用近期出版物在多大程度上与被引文章的引用影响力提升相关?
- RQ3基于社区和时效性的引用选择对计算机科学不同时期的影响有何差异?
- RQ4跨社区引用是否更可能带来高影响力出版物,尤其是在最具影响力的文献中?
- RQ5图书与其他出版类型在引用模式及其影响力方面有何不同?
主要发现
- 引用本学术社区内的文献与后续引用次数略有增加相关,表明对引用影响力有轻微正面影响。
- 引用近期文献也与引用次数略有增加相关,表明时效性有助于提升可见性和影响力。
- 对于高被引(高影响力)论文,引用本社区内文献与引用影响力之间的正相关关系显著减弱,暗示跨社区引用可能对突破性工作更为关键。
- 引用时效性与引用影响力之间的相关性在更近的时间段中略强,表明时效性在引用行为中的重要性正在上升。
- 图书中引用时间跨度与出度的相关性较低(−0.049*),低于论文(−0.069***),表明图书中更常引用旧文献,且每条引用的影响力较小。
- 跨社区的信息流动稀少且延迟,但一旦发生,可能对高影响力出版物产生贡献,尤其在最具影响力的文献中。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。