QUICK REVIEW

[论文解读] Trust the Process: Zero-Knowledge Machine Learning to Enhance Trust in Generative AI Interactions

Bianca-Mihaela Ganescu, Jonathan Passerat‐Palmbach|arXiv (Cornell University)|Feb 9, 2024

Adversarial Robustness in Machine Learning被引用 6

一句话总结

论文提出使用零知识证明来可验证地确保生成式AI模型的输出来自正确的模型，保护隐私，并引入 snarkGPT 作为 GPT-2–级别的 ZKML 流水线，附带经验可扩展性分析。

ABSTRACT

Generative AI, exemplified by models like transformers, has opened up new possibilities in various domains but also raised concerns about fairness, transparency and reliability, especially in fields like medicine and law. This paper emphasizes the urgency of ensuring fairness and quality in these domains through generative AI. It explores using cryptographic techniques, particularly Zero-Knowledge Proofs (ZKPs), to address concerns regarding performance fairness and accuracy while protecting model privacy. Applying ZKPs to Machine Learning models, known as ZKML (Zero-Knowledge Machine Learning), enables independent validation of AI-generated content without revealing sensitive model information, promoting transparency and trust. ZKML enhances AI fairness by providing cryptographic audit trails for model predictions and ensuring uniform performance across users. We introduce snarkGPT, a practical ZKML implementation for transformers, to empower users to verify output accuracy and quality while preserving model privacy. We present a series of empirical results studying snarkGPT's scalability and performance to assess the feasibility and challenges of adopting a ZKML-powered approach to capture quality and performance fairness problems in generative AI models.

研究动机与目标

激励在生成式AI中实现公平、透明和可靠性，尤其在医疗和金融情境下。
开发一个协议，验证远程AI服务使用的是精确请求的模型，而不暴露权重。
利用 zkSNARKs 提供对正确模型执行和输出完整性的密码学证明。
通过 GPT-2 尺寸的变换器（nanoGPT）展示 ZKML 的可行性，并评估可扩展性和内存约束。

提出的方法

描述基于 zkSNARK 的 AI 推断验证（ZKML），以及它如何提供输出来自所请求模型的证明。
介绍 snarkGPT，一个可验证的 ZKML 流水线，用于 GPT-2–样变换器，改造以在 Halo2/KZG 后端上工作。
解释 EZKL 和 Halo2 作为用于神经网络推断的 zkSNARK 构建后端，包括电路矩阵和多项式约束。
将变换器组件映射到适合 zkSNARK 证明的有限域，解决自注意力和其他非线性问题。

实验结果

研究问题

RQ1如何使用 zkSNARK 来验证 AI 推断是否来自客户端请求的确切模型？
RQ2ZKML 是否通过确保统一的模型行为而不暴露权重来提供性能公平性？
RQ3在 GPT-2 规模上为基于变换器的推断生成 zkSNARK 证明的实际成本（时间和内存）是多少？
RQ4模型架构和电路表示如何影响 ZKML 的约束数和证明效率？
RQ5ZKML 方法能否扩展到超出 GPT-类架构的其他神经网络模型？

主要发现

ZKML 使得在给定公共输入和私有模型权重证人时，输出由指定模型生成的密码学证明成为可能。
snarkGPT 演示了一个 GPT-2 规模的验证器在 ZKML 流水线中的可行性，包括客户端对证明进行端到端验证的协议。
实证结果显示证明生成成本随嵌入维度和变换器层数增加而增加，凸显非线性扩展的考虑。
电路矩阵大小对证明生成时间和内存有显著影响；更大的矩阵在某些配置中会产生高达数百GB的内存使用。
nanoGPT 的 M/N 比例（约束与参数的比）显著高于 Modulus Labs MLP 模型，表明基于变换器的模型带来更重的证明工作负载。
研究证实 ZKML 的广泛适用性超出 GPT 架构，尽管变换器模型相较于非变换器网络面临不同的挑战。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。