Skip to main content
QUICK REVIEW

[논문 리뷰] Towards Standardization of Data Licenses: The Montreal Data License

Misha Benjamin, Paul Gagnon|arXiv (Cornell University)|2019. 03. 21.
Scientific Computing and Data Management참고 문헌 7인용 수 25
한 줄 요약

이 논문은 인공지능 및 기계학습 분야에서 데이터를 라이선스화하기 위한 표준화되고 모듈러한 프레임워크인 몬트리올 데이터 라이선스(MDL)를 제안한다. 이는 오픈소스 소프트웨어 라이선싱을 모델로 삼고 있으며, 데이터 사용 권한의 분류 체계와 웹 기반 도구를 통해 맞춤형 라이선스 문구를 생성함으로써 AI/ML 분야의 법적 모호성 감소, 거래 비용 절감, 그리고 보다 공정하고 투명한 데이터 시장 조성에 기여한다.

ABSTRACT

This paper provides a taxonomy for the licensing of data in the fields of artificial intelligence and machine learning. The paper's goal is to build towards a common framework for data licensing akin to the licensing of open source software. Increased transparency and resolving conceptual ambiguities in existing licensing language are two noted benefits of the approach proposed in the paper. In parallel, such benefits may help foster fairer and more efficient markets for data through bringing about clearer tools and concepts that better define how data can be used in the fields of AI and ML. The paper's approach is summarized in a new family of data license language - extit{the Montreal Data License (MDL)}. Alongside this new license, the authors and their collaborators have developed a web-based tool to generate license language espousing the taxonomies articulated in this paper.

연구 동기 및 목표

  • 인공지능 및 기계학습 분야에서 표준화되고 투명한 데이터 라이선싱의 부재를 해결하며, 오픈소스 소프트웨어 라이선싱의 성공을 모방한다.
  • 일致한 용어와 구조화된 라이선싱을 통해 권리와 의무를 명확히 하여 데이터 시장에서의 거래 비용과 법적 불확실성을 줄인다.
  • 명확하고 예측 가능하며 집행 가능한 데이터 사용 계약을 가능하게 하여 더 공정하고 효율적인 데이터 시장을 조성한다.
  • 개인 데이터 및 복잡한 데이터 자산을 포함한 다양한 용도에 대응할 수 있는 실용적이고 모듈러한 라이선스 프레임워크를 제공한다.
  • 무료로 이용 가능한 웹 기반 라이선스 생성기와 재사용 가능한 라이선스 템plate를 제공하여 AI/ML 커뮤니티 전반의 도입을 촉진한다.

제안 방법

  • AI/ML 환경에서의 데이터 사용에 관한 허가, 제한 및 조건을 분류하는 데이터 사용 권한의 분류 체계를 개발한다.
  • 제안된 분류 체계를 기반으로 맞춤형 라이선스 조건을 가능하게 하는 모듈러 라이선스 패밀리로서 몬트리올 데이터 라이선스(MDL)를 설계한다.
  • 정의된 권리 분류 체계에서 사용자가 선택한 항목을 바탕으로 라이선스 문구를 생성하는 웹 기반 도구를 www.montrealdatalicense.com 에 구현한다.
  • 데이터의 재산권이 아닌 이행 가능한 계약적 접근 권리에 기반하여, 데이터의 법적 차이점(예: 데이터베이스 권리 및 저작권)을 고려한다.
  • 기존의 기계학습 메타데이터 표준(예: Gebru 등, 2018; Mitchell 등, 2019)과 통합하여 투명성과 상호운용성을 향상시킨다.
  • 스스로를 빠르게 평가할 수 있도록 표준화된 요약 차트(예: 부록 2 및 3)를 제공하여 사용성과 비교 가능성 향상

실험 결과

연구 질문

  • RQ1AI 및 기계학습 분야의 데이터에 대해 표준화되고 모듈러한 라이선싱 프레임워크가 법적 모호성과 거래 비용을 얼마나 줄일 수 있는가?
  • RQ2AI/ML 개발의 투명성, 공정성, 확장성에 기여하기 위해 데이터 라이선스에 포함되어야 할 핵심 권리와 조건은 무엇인가?
  • RQ3법적 대우 방식과 사용 패턴의 차이를 감안할 때, 오픈소스 소프트웨어를 모델로 삼은 라이선싱 모델이 데이터 자산에 얼마나 적합하게 적용될 수 있는가?
  • RQ4구조화된 권리 분류 체계를 기반으로 웹 기반 도구가 어떻게 법적으로 타당하고 맞춤형 라이선스 조건을 효과적으로 생성할 수 있는가?
  • RQ5더 명확한 라이선스 조건이 개인정보 보호 규정(GDPR 등) 준수를 향상시킬 수 있는가? 특히 더 구체적이고 정보 기반의 동의 메커니즘을 가능하게 함으로써

주요 결과

  • 몬트리올 데이터 라이선스(MDL)는 법적 모호성 감소와 투명성 향상을 목적으로 한 모듈러하고 맞춤형 라이선스 프레임워크를 제공한다.
  • 제안된 데이터 사용 권한 분류 체계는 허가, 제한 및 조건을 일관되게 분류하여 데이터 사용 조건을 더 명확히 전달하는 데 기여한다.
  • www.montrealdatalicense.com 에서 제공하는 웹 기반 라이선스 생성기는 사용자가 선택한 권리 기반으로 맞춤형 라이선스 문구를 생성할 수 있어 접근성과 도입을 촉진한다.
  • 개인 데이터에 대해 특정하고 정보 기반의 동의 메커니즘을 가능하게 하여 규정 준수를 지원함으로써, GDPR 등의 표준과 일치시킨다.
  • 표준화된 요약 차트(예: 부록 2 및 3)를 통해 이해관계자가 제공된 권리를 신속하게 평가할 수 있어 심사 시간을 단축하고 데이터 시장의 효율성을 향상시킨다.
  • 데이터의 재산권이 아닌 이행 가능한 계약적 접근 권리에 중점을 두며, 데이터베이스 권리 및 저작권과 같은 법적 차이점을 인정한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.