[论文解读] Research Communities in cyber security: A Comprehensive Literature Review
本论文基于1949年至2020年的Scopus数据,利用Louvain社区检测算法,对98,373名网络与信息安全研究人员的大型引文网络进行了分析,识别出12个顶级研究社区和80个子社区。其主要贡献在于通过数据驱动方式绘制了网络与信息安全研究社区的图谱,揭示了对密码学、生物识别技术和信息隐藏的强烈关注,而治理、风险管理及软件生命周期等主题则明显被低估。
In order to provide a coherent overview of cyber security research, the Scopus academic abstract and citation database was mined to create a citation graph of 98,373 authors active in the field between 1949 and early 2020. The Louvain community detection algorithm was applied to the graph in order to identify existing research communities. The analysis discovered twelve top-level communities: access control, authentication, biometrics, cryptography (I & II), cyber-physical systems, information hiding, intrusion detection, malwares, quantum cryptography, sensor networks, and usable security. These top-level communities were in turn composed of a total of 80 sub-communities. The analysis results are presented for each community in descriptive text, sub-community graphs, and tables with, for example, the most-cited papers and authors. A comparison between the detected communities and topical areas defined by other related work, is also presented, demonstrating a greater researcher emphasis on cryptography, quantum cryptography, information hiding and biometrics, at the expense of laws and regulation, risk management and governance, and security software lifecycle.
研究动机与目标
- 提供对70多年间网络与信息安全研究社区的全面、数据驱动的概览。
- 基于引文模式和作者合作网络,识别并表征不同的研究社区。
- 将检测到的社区与CyBOK及Baset与Denning的基于LDA的主题建模等现有知识框架进行比较。
- 揭示研究重点在结构与主题上的不平衡,特别是与政策、治理及软件生命周期相关的方面。
提出的方法
- 基于1949年至2020年初、关键词包含“信息安全性”或“网络与信息安全”的文献,从Scopus构建了98,373名作者的引文图谱。
- 在作者引文网络上应用Louvain算法进行社区检测,以识别出具有凝聚力的研究社区。
- 采用多阶段关键词过滤流程(初始关键词、异常值剔除和术语优化)以提升数据质量和相关性。
- 通过Scopus API收集并处理数据,将结果存储于Google Cloud Datastore,以实现高效检索与分析。
- 为每个社区生成描述性摘要、子社区图谱以及高被引论文和作者的表格。
- 与CyBOK及Baset与Denning的LDA主题建模结果进行对比分析,以评估一致性与差异性。
实验结果
研究问题
- RQ1网络与信息安全领域的主要研究社区有哪些?它们在时间维度和子主题上的结构如何?
- RQ2检测到的研究社区与CyBOK及Baset与Denning的LDA主题模型等既有的知识框架相比有何异同?
- RQ3网络与信息安全研究在多大程度上偏向于密码学、生物识别等技术主题,而对治理和风险管理等领域的关注明显不足?
- RQ4地理与机构因素如何影响研究社区的形成与演变?
- RQ5在每个识别出的研究社区中,最具影响力的论文和作者分别是谁?
主要发现
- 识别出12个顶级研究社区:访问控制、身份认证、生物识别、密码学(I与II)、信息物理系统、信息隐藏、入侵检测、恶意软件、量子密码学、传感器网络以及可用安全。
- 共检测到80个子社区,每个子社区具有独特的研究焦点、出版场所及演化轨迹。
- 各社区内被引最高的论文多为密码学、生物识别和入侵检测领域的奠基性工作,例如RSA算法和隐写术的开创性论文。
- 与治理、风险管理及软件生命周期主题相比,密码学、量子密码学、信息隐藏和生物识别技术获得了显著更高的研究关注度。
- 社区结构显示出地理集聚特征,某些地区在特定子社区中占据主导地位,例如北美在可用安全领域、欧洲在密码学领域。
- 与CyBOK及Baset与Denning的LDA模型相比,研究社区与“密码学”和“恶意软件”主题高度一致,但“形式化方法”和“方法论”主题代表性较弱,表明这些主题可能分散于多个社区之中。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。