[论文解读] Email as Spectroscopy: Automated Discovery of Community Structure within Organizations
本文提出一种基于图的算法,利用介数中心性自动从组织电子邮件日志中检测实践社群。在包含一百万封邮件的语料库上应用该方法,有效识别出大规模通信网络中的正式与非正式社群及其领导角色,经定性实地评估验证。
We describe a methodology for the automatic identification of communities of practice from email logs within an organization. We use a betweeness centrality algorithm that can rapidly find communities within a graph representing information flows. We apply this algorithm to an email corpus of nearly one million messages collected over a two-month span, and show that the method is effective at identifying true communities, both formal and informal, within these scale-free graphs. This approach also enables the identification of leadership roles within the communities. These studies are complemented by a qualitative evaluation of the results in the field.
研究动机与目标
- 开发一种基于通信数据自动识别组织内实践社群的自动化方法。
- 在大规模电子邮件网络中检测正式与非正式社群。
- 利用网络中心性度量识别检测到社群中的领导角色。
- 通过真实组织环境中的定性实地评估验证该方法。
- 展示基于图的分析在真实世界电子邮件语料中的有效性。
提出的方法
- 作者将电子邮件通信建模为有向图,用户作为节点,消息作为加权边。
- 应用介数中心性算法,通过测量网络中边的介数来检测社群边界。
- 该算法通过迭代移除介数最高的边,揭示自然的社群划分。
- 社群被定义为内部通信密集、外部连接稀疏的用户群体。
- 领导角色通过社群内高介数中心性推断得出。
- 该方法应用于近两百万封邮件的真实电子邮件语料库,时间跨度为两个月。
实验结果
研究问题
- RQ1电子邮件通信模式能否揭示组织内正式与非正式社群的存在?
- RQ2介数中心性在大规模电子邮件网络中检测社群结构的准确性如何?
- RQ3能否通过网络中心性度量在组织电子邮件数据中识别出领导角色?
- RQ4自动检测到的社群与真实组织结构相比如何?
- RQ5该方法在不同组织环境中的泛化能力如何?
主要发现
- 介数中心性方法成功识别出与组织中已知正式与非正式分组一致的社群。
- 该算法检测到的社群内部凝聚力高、外部连接稀疏,表明其结构有效性。
- 领导角色被一致识别为社群内介数中心性高的用户。
- 该方法在大规模网络中具有高效可扩展性,可在两个月内处理近一百万封邮件。
- 定性评估证实,检测到的社群与现实中的协作模式相符。
- 该方法在识别结构化与新兴组织社群方面表现出强健性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。