[论文解读] Mining the Temporal Evolution of the Android Bug Reporting Community via Sliding Windows
本文提出了一种基于滑动窗口的社交网络分析(SNA)方法,以捕捉Android错误报告社区中参与者角色的时序演化。通过分析30天重叠窗口内的错误报告,该方法利用介数中心性识别局部行为模式,揭示了在全球分析中不可见的临时专家角色,并利用版本控制系统和发布历史数据验证了研究发现。
The open source development community consists of both paid and volunteer developers as well as new and experienced users. Previous work has applied social network analysis (SNA) to open source communities and has demonstrated value in expertise discovery and triaging. One problem with applying SNA directly to the data of the entire project lifetime is that the impact of local activities will be drowned out. In this paper we provide a method for aggregating, analyzing, and visualizing local (small time periods) interactions of bug reporting participants by using the SNA to measure the betweeness centrality of these participants. In particular we mined the Android bug repository by producing social networks from overlapping 30-day windows of bug reports, each sliding over by day. In this paper we define three patterns of participant behaviour based on their local centrality. We propose a method of analyzing the centrality of bug report participants both locally and globally, then we conduct a thorough case study of the bug reporter's activity within the Android bug repository. Furthermore, we validate the conclusions of our method by mining the Android version control system and inspecting the Android release history. We found that windowed SNA analysis elicited local behaviour that were invisible during global analysis.
研究动机与目标
- 解决全局SNA在捕捉长期开源社区中短期、局部互动方面的局限性。
- 识别在全局网络分析中被掩盖的Android错误报告社区中的临时专家行为。
- 开发一种时间感知的方法来度量参与者中心性,以捕捉短期时间间隔内的动态角色。
- 利用Android版本控制系统和发布历史数据,对外部数据验证SNA识别出的局部行为模式。
提出的方法
- 在Android错误存储库的时间线上构建重叠的30天滑动窗口,以分析局部互动动态。
- 从每个窗口内错误报告的互动构建特定时间的社交网络,将参与者作为节点,互动作为边。
- 在每个窗口内计算每位参与者的介数中心性,以度量其在信息流中的局部影响力和角色。
- 基于局部中心性随时间的变化,定义三种行为模式:持续专家、新兴专家和衰减专家。
- 将SNA结果与版本控制系统数据和发布历史进行相关性分析,以验证识别出的行为模式的重要性。
- 对个别错误报告者进行详细案例研究,以说明该方法检测角色演变的能力。
实验结果
研究问题
- RQ1在Android错误报告社区中,参与者角色如何在短期时间间隔内演化,其中心性呈现出何种模式?
- RQ2局部SNA度量在多大程度上揭示了在全球网络分析中无法检测到的专家行为?
- RQ3中心性变化的时序模式能否通过外部软件工程工件(如提交日志和发布说明)得到验证?
- RQ4错误报告者的行为模式(如新兴或衰减专家)如何与对代码库的实际贡献相关联?
主要发现
- 窗口化SNA分析成功识别出在全局分析中未被发现的错误报告参与者局部行为模式。
- 基于局部介数中心性随时间的变化,识别出三种不同的行为模式:持续专家、新兴专家和衰减专家。
- 在短时间窗口内具有高局部中心性的参与者,通常与之后对代码库做出重大贡献的个体相对应,该结论得到了版本控制数据的确认。
- 该方法揭示了在特定时间段内对错误分类或修复起到关键作用的临时专家,这些专家在长期全局网络度量中并不突出。
- 利用Android发布历史进行验证,确认错误报告网络中高局部中心性时期通常与重大发布或关键修复时期相吻合。
- 案例研究表明,局部中心性模式能够追踪个体报告者影响力的上升与下降,为社区动态提供了深入见解。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。