QUICK REVIEW

[논문 리뷰] Summary Analysis of the 2017 GitHub Open Source Survey

R. Stuart Geiger|arXiv (Cornell University)|2017. 01. 01.

Algorithms and Data Compression참고 문헌 4인용 수 10

한 줄 요약

이 논문은 2017년 GitHub 오픈소스 설문조사 데이터셋에 대한 종합적이고 재현 가능한 요약 분석을 제시하며, 기술적 통계와 시각화를 통해 50개 이상의 설문 항목에 대한 응답을 기록한다. 분석 결과, 응답자의 93.12%가 오픈소스 기여를 막는 주요 장애물로 열악한 문서화를 지적했으며, 79.21%는 응답이 없음을 기여를 저해하는 요인으로 언급했고, 19.97%는 괴롭힘 경험 후 기여를 중단했다—이는 오픈소스 커뮤니티의 체계적 인식성 및 온보딩 문제를 드러낸다.

ABSTRACT

This report is a high-level summary analysis of the 2017 GitHub Open Source Survey dataset, presenting frequency counts, proportions, and frequency or proportion bar plots for every question asked in the survey. This report was generated from a Jupyter notebook that can be found on OSF at http://doi.org/10.17605/OSF.IO/ENRQ5.

연구 동기 및 목표

2017년 GitHub 오픈소스 설문조사 데이터셋에서 널리 사용되는 주장에 대한 안정적이고 인용 가능한 참고자료를 제공하기 위해.
모든 설문 항목과 응답 분포의 완전하고 재현 가능한 요약을 제공함으로써 향후 연구를 지원하기 위해.
기여를 저해하는 행동과 괴롭힘의 빈도를 기록하여, 특히 기여를 막는 요인으로 작용하는 사례를 규명하기 위해.
공개 데이터와 코드를 CC-BY-4.0 라이선스 하에 배포함으로써 투명성과 재현 가능성을 높이기 위해 분석 결과를 Jupyter 노트북 형식으로 공개하기 위해.

제안 방법

데이터 처리 및 시각화에 Python 3.6, Pandas, NumPy, SciPy, Matplotlib, Seaborn을 사용한다.
모든 설문 항목은 개별적으로 또는 그룹화된 패널로 분석되며, 각 응답 유형에 대해 빈도 수와 비율이 계산된다.
응답 분포를 시각화하기 위해 각 항목에 대해 막대 그래프를 생성하며, 결과는 공개된 Jupyter 노트북을 통해 재현 가능하다.
통계 모델링, 하위군 비교, 리커트 척도 응답을 수치 값으로 재코딩하는 작업은 수행하지 않는다.
분석은 완전히 재현 가능하며 GitHub 및 Open Science Framework에 호스팅되어 있으며, 모든 코드와 데이터가 공개되어 있다.
보고서는 Jupyter 노트북에서 nbconvert를 통해 생성되어 결과의 투명성과 추적 가능성을 보장한다.

실험 결과

연구 질문

RQ1기여자 중 얼마나 많은 비율이 프로젝트에서 응답 없음이나 무시하는 답변을 경험하거나 목격했는가?
RQ2괴롭힘 또는 적대적 행동은 오픈소스 커뮤니티에서 얼마나 흔한가? 가장 흔하게 보고된 형태는 무엇인가?
RQ3기여자가 부정적인 경험으로 인해 기여를 중단한 비율은 얼마이며, 그에 따라 어떤 조치를 취하는가?
RQ4성별, 민족, 어학 능력 등의 디모그래픽 요소가 배제되거나 괴롭힘 경험과 어떤 관련이 있는가?
RQ5기여를 하지 않는 주요 이유는 무엇이며, 경험 수준이나 배경에 따라 이는 어떻게 다를까?

주요 결과

93.12%의 응답자가 오픈소스 프로젝트 기여를 막는 주요 장애물로 열악하거나 나쁜 문서화를 지적했다.
79.21%는 응답이 없음을 기여를 저해하는 행동으로 언급했으며, 이는 참여 장벽으로서 가장 흔히 보고된 요인이다.
기여자의 19.97%는 괴롭힘 경험 후 기여를 완전히 중단했으며, 그 중 15.41%는 이를 계기로 비공개 커뮤니티에 가입했다.
17.05%는 환영하지 않는 언어를 경험했고, 5.28%는 이름으로 부르는 행동을 겪어, 지속적인 인격적 적대감을 드러냈다.
괴롭힘 경험을 겪은 이들 중 48.68%는 해당 행동을 간과했다—이는 회복 조치나 지원 체계의 부족함을 시사한다.
괴롭힘에 가장 효과적인 대응은 사용자 차단이었으며(34.52% 효과성), 이어 유지보수자에게 신고하는 것이(13.21%) 뒤이었다. 법적 조치나 경찰 기관과의 연락은 거의 사용되지 않았다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.