QUICK REVIEW

[論文レビュー] Generative AI and the Digital Commons

Saffron Huang, Divya Siddarth|arXiv (Cornell University)|Mar 20, 2023

Scientific Computing and Data Management被引用数 21

ひとこと要約

この論文は Generative Foundation Models (GFMs) がデジタル・コモンズに依存する方法を分析し、コモンズを保護・持続させつつリスクを緩和するガバナンス、データ共有、資金調達の方針を提案します。コンソーシアム、データ提供の規範、入力データのガバナンスを強調し、GFMs の開発を公共の利益と整合させます。

ABSTRACT

Many generative foundation models (or GFMs) are trained on publicly available data and use public infrastructure, but 1) may degrade the "digital commons" that they depend on, and 2) do not have processes in place to return value captured to data producers and stakeholders. Existing conceptions of data rights and protection (focusing largely on individually-owned data and associated privacy concerns) and copyright or licensing-based models offer some instructive priors, but are ill-suited for the issues that may arise from models trained on commons-based data. We outline the risks posed by GFMs and why they are relevant to the digital commons, and propose numerous governance-based solutions that include investments in standardized dataset/model disclosure and other kinds of transparency when it comes to generative models' training and capabilities, consortia-based funding for monitoring/standards/auditing organizations, requirements or norms for GFM companies to contribute high quality data to the commons, and structures for shared ownership based on individual or community provision of fine-tuning data.

研究の動機と目的

GFMsがデジタル・コモンズとどのように相互作用し、影響を与えるかを評価する
GFMsがデジタル・コモンズと民主主義に及ぼすリスクを特定する
コンサルティア、データ提供規範を含むガバナンス構造を提案してコモンズを持続させる
データ生産者と寄与者に報酬を与える資金調達と共同所有のモデルを提案する
GFMsの実践的なモニタリング、監査、標準化を行う実現経路を概説する

提案手法

GFMsを定義し、デジタル・コモンズのインフラとデータソースへの依存をマッピングする
情報の品質、民主主義、労働動態を含むデジタル・コモンズへのリスクを分析する
コンソーシア、データ提供規範、入力データのガバナンスなどのガバナンス機構を提案する
データ配当、著作権/ライセンス、個人データ権などの政策オプションの利点と欠点を評価する
モニタリング、監査、標準設定機関の実装戦略を推奨する

実験結果

リサーチクエスチョン

RQ1GFMsがデジタル・コモンズに依存し、潜在的にそれを損なう可能性はどうか
RQ2コモンズへのリスクを緩和しつつ責任あるGFMs開発を促進するガバナンスモデルは何か
RQ3コンソーシア、ノームベースのデータ提供、入力データ・ガバナンスの比較的利点と欠点は何か
RQ4データ生産者をコモンズ重視の枠組みの中でどのように報酬・補償できるか
RQ5実務でGFMsをモニタリング・監査するための構造はどのように実現可能か？

主な発見

GFMsはデジタル・コモンズに依存する一方で、AI出力の急速な生成と展開を通じてコモンズを侵食する可能性がある
データ生産者とコモンズの報酬に関する未解決の問題はガバナンスのギャップと潜在的な収益化の緊張を浮き彫りにする
モニタリング、監査、標準設定のためのコンソーシアは複数の利害関係者の入力を調整してリスクを管理できる
コモンズへの高品質データ提供をGFM企業に求めるノームはデータの整合性とガバナンスを改善できる
モデル訓練の入力データに基づくガバナンス構造はデータ提供者、研究者、ユーザー間のインセンティブを整合させる
論文はデータ配当/課税、より厳格な著作権、個人データ権など複数の政策オプションを検討しており、効果の測定にはインフラとガバナンスの整備が必要である

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。