Skip to main content
QUICK REVIEW

[论文解读] The Gradient of Generative AI Release: Methods and Considerations

Irene Solaiman|arXiv (Cornell University)|Feb 5, 2023
Scientific Computing and Data Management被引用 16
一句话总结

本文提出一种梯度框架,对六个生成式人工智能发布的访问级别进行排序,分析发布趋势与安全控制,并主张通过多学科治理与投资来降低风险。

ABSTRACT

As increasingly powerful generative AI systems are developed, the release method greatly varies. We propose a framework to assess six levels of access to generative AI systems: fully closed; gradual or staged access; hosted access; cloud-based or API access; downloadable access; and fully open. Each level, from fully closed to fully open, can be viewed as an option along a gradient. We outline key considerations across this gradient: release methods come with tradeoffs, especially around the tension between concentrating power and mitigating risks. Diverse and multidisciplinary perspectives are needed to examine and mitigate risk in generative AI systems from conception to deployment. We show trends in generative system release over time, noting closedness among large companies for powerful systems and openness among organizations founded on principles of openness. We also enumerate safety controls and guardrails for generative systems and necessary investments to improve future releases.

研究动机与目标

  • 提出一个梯度框架,将生成式AI系统的发布访问从完全关闭到完全开放进行分类。
  • 分析跨模态和组织类型的历史发布趋势。
  • 确定实现更安全未来发布所需的安全控制、护栏和必要的投资。
  • 主张在AI发布的治理、政策与实际伦理方面采用多学科视角。

提出的方法

  • 定义一个六级系统访问梯度(从完全关闭到完全开放)来构建发布决策。
  • 整理发布中涉及的组成部分:模型访问、风险分析组件和复制组件。
  • 概述关键发布考量因素,包括权力集中、风险缓解和问责机制。
  • 总结横跨文档、技术工具、社区努力和政策措施的安全控制与护栏。
  • 分析随时间推移,大型企业与开放倡议在发布时机和开放性方面的趋势。

实验结果

研究问题

  • RQ1生成式AI发布梯度中的各个不同水平及其对访问和控制的含义是什么?
  • RQ2在实践中,发布方法如何在权力集中、风险与安全之间取舍?
  • RQ3在各发布水平上,哪些安全控制、护栏和治理机制是有效的?
  • RQ4在模态和组织之间,可以观察到哪些关于发布开放性与保密性的历史趋势?
  • RQ5为在未来实现更负责任的发布,需要哪些投资和多学科行动。

主要发现

  • 开放发布在较小的组织和较不强大的模型中更为普遍,而大型公司则倾向于闭放发布。
  • 来自以开放为基础的组织的开放倡议显示出完全透明,但可能促成高风险的用途;闭放发布则集中权力。
  • 文档、速率限制、检测模型和许可是跨发布使用的实际安全控制之一。
  • 多学科专业知识与治理对于在发布生命周期中预测、评估和缓解伤害至关重要。
  • 在可访问接口、资源共享、伦理培训和专家前瞻方面需要大量投资,以改善未来的发布。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。