[논문 리뷰] ORES: Lowering Barriers with Participatory Machine Learning in Wikipedia
ORES는 Wikipedia 편집자가 개방형 API를 통해 실시간 편집 점수 분류기들을 공동으로 개발하고 감사하며 배포할 수 있도록 해주는 參與型 기계학습 시스템이다. 데이터 정제, 모델 훈련, 배포를 분리함으로써 기술적 장벽을 낮추고 알고리즘 거버넌스에 대한 커뮤니티의 참여를 확대하여 44개 언어에서 110개의 분류기로 구성된 투명하고 확장 가능한 콘텐츠 모니터링을 가능하게 한다.
Algorithmic systems---from rule-based bots to machine learning classifiers---have a long history of supporting the essential work of content moderation and other curation work in peer production projects. From counter-vandalism to task routing, basic machine prediction has allowed open knowledge projects like Wikipedia to scale to the largest encyclopedia in the world, while maintaining quality and consistency. However, conversations about how quality control should work and what role algorithms should play have generally been led by the expert engineers who have the skills and resources to develop and modify these complex algorithmic systems. In this paper, we describe ORES: an algorithmic scoring service that supports real-time scoring of wiki edits using multiple independent classifiers trained on different datasets. ORES decouples several activities that have typically all been performed by engineers: choosing or curating training data, building models to serve predictions, auditing predictions, and developing interfaces or automated agents that act on those predictions. This meta-algorithmic system was designed to open up socio-technical conversations about algorithms in Wikipedia to a broader set of participants. In this paper, we discuss the theoretical mechanisms of social change ORES enables and detail case studies in participatory machine learning around ORES from the 5 years since its deployment.
연구 동기 및 목표
- 위키백과에서 알고리즘 기반 콘텐츠 모니터링에 대한 커뮤니티 참여 부족 문제를 해결하기 위해 위키백과의 기계학습 개발을 분산화한다.
- 전문가가 아닌 편집자가 모델 훈련과 감사를 위해 기여할 수 있는 기술적 장벽을 줄인다.
- 위키백과와 같은 대규모 피어 프로덕션 플랫폼에서 인공지능 시스템의 투명하고 책임감 있는 개방형 거버넌스를 가능하게 한다.
- 사회기술적 설계가 알고리즘 시스템에서 공정성, 투명성, 커뮤니티의 동의를 어떻게 지원할 수 있는지 탐색한다.
- 참여형 기계학습이 중심 집중이 아닌 다국어, 분산형 커뮤니티에서 스케일링될 수 있음을 입증한다.
제안 방법
- ORES는 커뮤니티가 정제한 데이터셋에 기반해 훈련된 다수의 독립적 분류기에서 실시간 예측을 제공하는 클라우드 기반 API를 제공한다.
- 시스템은 데이터 정제, 모델 훈련, 감사, 배포를 분리함으로써 자원봉사자 편집자들이 독립적으로 기여할 수 있도록 한다.
- 분류기는 레이블이 부여된 편집 데이터를 기반으로 지도학습을 통해 훈련되며, 성능 모니터링과 반복적인 커뮤니티 감사를 통해 평가된다.
- ORES는 '손상/손상 없음', '양심적/악의적', 기사 품질, 주제 태깅 등 다양한 분류 작업을 지원한다.
- 플랫폼은 오픈소스 코드와 데이터를 기반으로 하며, 모든 개발 및 거버넌스 과정이 공개적으로 접근 가능하고 공동으로 관리된다.
- 비전문가 기여자를 위한 접근 장벽을 낮추기 위해 Jupyter Notebook 기반의 튜토리얼이 개발되었다.
실험 결과
연구 질문
- RQ1피어 프로덕션 플랫폼에서 기계학습 시스템은 전문 엔지니어 외의 커뮤니티 참여를 어떻게 가능하게 할 수 있는가?
- RQ2대규모 알고리즘 기반 콘텐츠 모니터링에서 투명성, 책임감, 공정성을 보장하기 위한 사회기술적 메커니즘은 무엇인가?
- RQ3분산형, 커뮤니티 주도의 분류기 개발 및 감사 프로세스는 모델 성능과 신뢰도에 어떤 영향을 미치는가?
- RQ4높은 위험도를 지닌 모니터링 환경에서 비전문가 기여자가 기계학습 개발에 참여함으로써 발생할 수 있는 예기치 못한 결과는 무엇인가?
- RQ5참여형 기계학습 시스템이 ORES처럼 구조적 불평등을 알고리즘 거버넌스에서 줄이는 데 얼마나 기여할 수 있는가?
주요 결과
- ORES는 44개 언어에서 110개의 분류기를 성공적으로 구현하여, 페이저 대비 감지 및 기사 품질 평가와 같은 다양한 모니터링 작업에 실시간 편집 점수를 제공했다.
- 시스템은 50개 이상의 커뮤니티 주도 분류기 프로젝트를 지원하여 비전문가 편집자들이 데이터 정제와 모델 감사에 지속적으로 참여하고 있음을 입증했다.
- 커뮤니티 감사를 통해 언어 편집판에 따라 모델 성능에 상당한 격차가 있음을 확인했으며, 지역화된 커뮤니티 주도 개발의 중요성을 강조했다.
- Jupyter 노트북을 교육 도구로 사용함으로써 신규 기여자들이 모델 훈련 워크플로우를 이해하고 복제할 수 있었으며, 기계학습 개발의 민주화 경로를 보여주었다.
- 개ener의 특성에도 불구하고, 특히 적극적으로 참여하는 기여자들이 악성 편집 환경에서 모델 개발을 주도함에 따라 구조적 불평등이 강화될 가능성에 대한 우려가 남아 있다.
- 시스템은 중심 집중형 알고리즘 통제에서 더 분산된, CSCW 기반의 알고리즘 거버넌스 모델로의 전환을 지원하지만, 분산화가 증가함에 따라 새로운 거버넌스 과제가 나타나고 있다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.