QUICK REVIEW

[论文解读] Summary Analysis of the 2017 GitHub Open Source Survey

R. Stuart Geiger|arXiv (Cornell University)|Jan 1, 2017

Algorithms and Data Compression参考文献 4被引用 10

一句话总结

本文对2017年GitHub开源调查数据集进行了全面且可复现的汇总分析，通过描述性统计和可视化手段，对50多个调查问题的回答进行了系统性归档。结果显示，93.12%的受访者表示糟糕的文档是参与开源项目的主要阻碍因素，79.21%的人指出缺乏回应令人却步，19.97%的人在遭遇骚扰后停止了贡献——凸显了开源社区在包容性与新人融入方面存在的系统性挑战。

ABSTRACT

This report is a high-level summary analysis of the 2017 GitHub Open Source Survey dataset, presenting frequency counts, proportions, and frequency or proportion bar plots for every question asked in the survey. This report was generated from a Jupyter notebook that can be found on OSF at http://doi.org/10.17605/OSF.IO/ENRQ5.

研究动机与目标

为2017年GitHub开源调查数据集中的广泛性主张提供稳定且可引用的参考依据。
通过提供所有调查问题及响应分布的完整、可复现的汇总分析，促进未来研究。
记录不鼓励行为和骚扰在开源社区中的普遍程度，特别是那些阻碍参与的行为。
通过以CC-BY-4.0许可公开数据和代码，并以Jupyter Notebook形式发布分析，支持透明度与可复现性。

提出的方法

分析使用Python 3.6，结合Pandas、NumPy、SciPy、Matplotlib和Seaborn进行数据处理与可视化。
所有调查问题均单独或分组进行分析，针对每个回答类别计算频数和比例。
为每个问题生成条形图以可视化响应分布，结果可通过公开的Jupyter Notebook完全复现。
未进行任何统计建模、子组比较，也未将李克特量表响应重新编码为数值。
分析完全可复现，并托管于GitHub和Open Science Framework，所有代码与数据均公开可用。
报告通过nbconvert从Jupyter Notebook生成，确保结果的完全透明与可追溯。

实验结果

研究问题

RQ1在开源项目中，有多少比例的贡献者经历过或目睹过诸如缺乏回应或轻蔑回复等不鼓励行为？
RQ2骚扰或敌对行为在开源社区中有多普遍？最常见的表现形式是什么？
RQ3有多少比例的贡献者因负面经历而停止了贡献？他们通常采取何种应对措施？
RQ4性别、种族和语言能力等人口统计因素如何与被排斥或遭受骚扰的经历相关联？
RQ5贡献者不参与开源的主要原因是什么？这些原因在经验水平或背景不同的群体中是否存在差异？

主要发现

93.12%的受访者表示，糟糕或低质量的文档是参与开源项目的主要阻碍因素。
79.21%的受访者指出，缺乏回应是最常被报告的参与障碍，也是最具阻碍性的行为。
19.97%的贡献者在遭遇骚扰后完全停止了贡献，其中15.41%因此选择加入私人社区。
17.05%的受访者报告遭遇过不友好的语言，5.28%报告遭受过人身攻击，表明人际敌意持续存在。
48.68%的受害者选择无视该行为，表明缺乏有效应对途径或支持机制。
应对骚扰最有效的措施是屏蔽用户（有效率达34.52%），其次是向维护者报告（13.21%），而采取法律行动或联系执法部门的情况极为罕见。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。