Skip to main content
QUICK REVIEW

[논문 리뷰] Generative AI and the Digital Commons

Saffron Huang, Divya Siddarth|arXiv (Cornell University)|2023. 03. 20.
Scientific Computing and Data Management인용 수 21
한 줄 요약

이 논문은 Generative Foundation Models (GFMs)가 디지털 커먼스에 의존하는 방식 을 분석하고 커먼스를 보호하고 지속시키기 위한 거버넌스, 데이터 공유 및 자금 조달 접근법을 제안한다. 이는 공익에 부합하도록 GFMs 개발을 조정하기 위해 컨소시엄, 데이터 기여 규범, 입력 데이터 거버넌스를 강조한다.

ABSTRACT

Many generative foundation models (or GFMs) are trained on publicly available data and use public infrastructure, but 1) may degrade the "digital commons" that they depend on, and 2) do not have processes in place to return value captured to data producers and stakeholders. Existing conceptions of data rights and protection (focusing largely on individually-owned data and associated privacy concerns) and copyright or licensing-based models offer some instructive priors, but are ill-suited for the issues that may arise from models trained on commons-based data. We outline the risks posed by GFMs and why they are relevant to the digital commons, and propose numerous governance-based solutions that include investments in standardized dataset/model disclosure and other kinds of transparency when it comes to generative models' training and capabilities, consortia-based funding for monitoring/standards/auditing organizations, requirements or norms for GFM companies to contribute high quality data to the commons, and structures for shared ownership based on individual or community provision of fine-tuning data.

연구 동기 및 목표

  • GFMs가 디지털 커먼스와 어떻게 상호작용하고 영향을 미치는지 평가
  • GFMs가 디지털 커먼스와 민주주의에 제기하는 위험 식별
  • 컨소시엄과 데이터 기여 규범을 포함한 거버넌스 구조를 제안하여 커먼스를 지속 가능하게 한다
  • 데이터 생산자와 기여자에게 보상을 제공하는 자금 조달 및 공유 소유 모델 제안
  • GFMs 실천을 모니터링, 감사, 표준화하기 위한 실질적 경로 제시

제안 방법

  • GFMs를 정의하고 디지털 커먼스 인프라 및 데이터 소스에 대한 의존성을 파악
  • 정보 품질, 민주주의, 노동 역학 등을 포함한 디지털 커먼스에 대한 위험 분석
  • 컨소시엄, 데이터 기여 규범, 입력 데이터 거버넌스 등의 거버넌스 메커니즘 제안
  • 데이터 배당금, 저작권/라이선스, 개인 데이터 권리 등의 정책 옵션의 장단점 평가
  • 모니터링, 감사 및 표준 제정 기구를 위한 구현 전략 권고

실험 결과

연구 질문

  • RQ1GFMs가 디지털 커먼스에 의존하고 잠재적으로 약화시키는 방식은 무엇인가?
  • RQ2공유 자원에 대한 위험을 완화하면서 책임 있는 GFM 개발을 촉진할 수 있는 거버넌스 모델은 무엇인가?
  • RQ3컨소시엄, 규범 기반 데이터 기여, 입력 데이터 거버넌스의 비교적 장점과 단점은 무엇인가?
  • RQ4컨소시엄 중심 프레임워크에서 데이터 생산자를 어떻게 보상하거나 보상할 수 있는가?
  • RQ5실제로 GFMs를 모니터링하고 감사하기 위한 구조는 어떤 것이 실현 가능한가?

주요 결과

  • GFMs는 AI 출력의 빠른 생성 및 배치를 통해 디지털 커먼스에 의존하며 잠재적으로 이를 침식할 수 있다.
  • 데이터 생산자와 커먼스에 대한 보상에 관한 열린 질문은 거버넌스의 차이와 잠재적 수익화 긴장을 부각시킨다.
  • 모니터링, 감사 및 표준 제정을 위한 컨소시엄은 다수 이해관계자의 입력을 조정해 위험을 관리할 수 있다.
  • GFM 기업이 커먼스에 고품질 데이터를 기여하기 위한 규범은 데이터 무결성과 거버넌스를 개선할 수 있다.
  • 모델 학습을 위한 입력 데이터 기반의 거버넌스 구조는 데이터 공급자, 연구자, 사용자 간의 인센티브를 정렬할 수 있다.
  • 본 논문은 다양한 정책 옵션(데이터 배당/세금, 더 엄격한 저작권, 개인 데이터 권리)을 논의하며 실행 가능성과 상충 관계가 다르고, 효과를 모니터링할 인프라와 거버넌스의 필요성을 강조한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.