[論文レビュー] Toward Trustworthy AI Development: Mechanisms for Supporting Verifiable Claims
本論文は、AI開発に関する検証可能な主張を可能にする機関的、ソフトウェア的、ハードウェア的機構のツールボックスを提案し、説明責任と信頼できる進展を支援します。関係者間での検証可能性を高める実行可能な推奨とワークショップに裏打ちされたプロセスを概説します。
With the recent wave of progress in artificial intelligence (AI) has come a growing awareness of the large-scale impacts of AI systems, and recognition that existing regulations and norms in industry and academia are insufficient to ensure responsible AI development. In order for AI developers to earn trust from system users, customers, civil society, governments, and other stakeholders that they are building AI responsibly, they will need to make verifiable claims to which they can be held accountable. Those outside of a given organization also need effective means of scrutinizing such claims. This report suggests various steps that different stakeholders can take to improve the verifiability of claims made about AI systems and their associated development processes, with a focus on providing evidence about the safety, security, fairness, and privacy protection of AI systems. We analyze ten mechanisms for this purpose--spanning institutions, software, and hardware--and make recommendations aimed at implementing, exploring, or improving those mechanisms.
研究の動機と目的
- AIにおける検証可能な主張の必要性を倫理原則の補完として動機づけ、ユーザー、規制当局、開発者間の信頼ギャップを解消する。
- AIにおける検証可能な主張を定義し、検証の障壁を特定する。
- AI開発の検証可能性を高める機構の三位一体(機関、ソフトウェア、ハードウェア)を提案する。
- 検証可能な主張の機構の実装に向けた実行可能な推奨とロードマップを提供する。
提案手法
- 機構を三つの絡み合う柱:機関、ソフトウェア、ハードウェアに整理し、それぞれが異なる検証の視点に対応する。
- 既存の機構を調査し、安全性、セキュリティ、公正性、プライバシーの検証可能性のギャップを特定する。
- 具体的な推奨(例:第三者監査、レッドチーム演習、偏りと安全性の賞金、インシデントの共有)を提示し、それらの潜在的影響を正当化する。
- 検証障壁を対象とする問題中心の枠組みに推奨を根ざす。
- ワークショップ由来の洞察と付録を組み込み、背景、定義、補足分析を提供する。
実験結果
リサーチクエスチョン
- RQ1AIシステムおよび開発プロセスの主張の検証可能性を高める機構は何か?
- RQ2機関、ソフトウェア、ハードウェアの機構をどのように連携させ、ステークホルダー間で検証可能な説明責任を実現できるか?
- RQ3監査、レッドチーミング、インシデント共有を実施して信頼を強化するために、組織が具体的にどのようなステップを取れるか?
- RQ4検証可能な主張を信頼できるAI開発への道として用いることの限界と範囲は何か?
主な発見
- 機関、ソフトウェア、ハードウェアにまたがる多様な機構のツールボックスは、AI開発の主張の検証可能性を高められる。
- 第三者監査、レッドチーム演習、偏りと安全性のバウンティ、AIインシデントの共有が、機関的機構の要として提案されている。
- 監査証跡、解釈性、プライバシー保護付きMLは、システムの主張を裏付けるための重要なソフトウェア機構として強調されている。
- セキュアなハードウェア、高精度の計算測定、および学術界への計算資源支援は、プライバシー、セキュリティ、資源使用の主張を裏付けるハードウェア機構として特定されている。
- 報告書は、検証可能な主張が信頼のために必要であるが十分ではなく、法規制とガバナンス構造との整合性が必要であると強調している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。