Skip to main content
QUICK REVIEW

[论文解读] Differential Privacy for Functions and Functional Data

Rob Hall, Alessandro Rinaldo|arXiv (Cornell University)|Mar 12, 2012
Privacy-Preserving Technologies in Data参考文献 34被引用 93
一句话总结

本文提出一种框架,通过在再生核希尔伯特空间(RKHS)中根据函数的敏感性校准高斯过程噪声,实现函数发布(如密度估计器或分类函数)的差分隐私。关键贡献在于证明:当函数与噪声过程位于同一RKHS中时,通过将噪声方差设置为与函数敏感性的RKHS范数成比例,可实现差分隐私,从而实现具有正式隐私保障的私有核密度估计与核SVM。

ABSTRACT

Differential privacy is a framework for privately releasing summaries of a database. Previous work has focused mainly on methods for which the output is a finite dimensional vector, or an element of some discrete set. We develop methods for releasing functions while preserving differential privacy. Specifically, we show that adding an appropriate Gaussian process to the function of interest yields differential privacy. When the functions lie in the same RKHS as the Gaussian process, then the correct noise level is established by measuring the "sensitivity" of the function in the RKHS norm. As examples we consider kernel density estimation, kernel support vector machines, and functions in reproducing kernel Hilbert spaces.

研究动机与目标

  • 将差分隐私从有限维向量扩展至函数值输出,特别是在函数数据分析场景中。
  • 利用RKHS范数形式化函数敏感性的概念,实现隐私保护的函数发布。
  • 通过基于RKHS敏感性的噪声校准,开发一种实用方法,用于发布差分私有的核密度估计器与核SVM。
  • 证明添加方差与函数敏感性RKHS范数成比例的高斯过程,可确保(α, β)-差分隐私。
  • 提供一种计算上可行的框架,支持具有隐私保障的批量与在线函数发布。

提出的方法

  • 使用具有已知协方差核的高斯过程向目标函数添加噪声,以确保差分隐私。
  • 基于函数敏感性的RKHS范数校准噪声水平,其定义为在相邻数据库上函数输出差异的RKHS范数的上确界。
  • 通过确保估计函数与噪声过程共享相同的RKHS,将该方法应用于核密度估计与核SVM。
  • 利用矩阵求逆引理与舒尔补,高效计算在线设置下的条件分布,实现实时函数评估的隐私保障。
  • 采用特定的指数核K(x,y) = exp(−γ|x−y|),通过利用条件均值与方差计算中的稀疏性,实现高效的在线更新。
  • 实现批量与在线发布协议:批量通过从多元高斯分布中采样,在线通过顺序更新高斯过程的后部分布。

实验结果

研究问题

  • RQ1如何将差分隐私正式扩展至函数值输出,而非仅限于有限维向量或标量?
  • RQ2在函数设定下,函数的适当敏感性概念是什么?如何测量以确保隐私?
  • RQ3能否使用高斯过程对核密度估计器与核SVM等函数进行隐私化处理,同时保持其效用?
  • RQ4在在线或交互式环境中发布差分私有函数的计算可行性如何?
  • RQ5在再生核希尔伯特空间中发布函数时,如何最优地校准噪声水平以在隐私与效用之间取得平衡?

主要发现

  • 添加方差与函数敏感性RKHS范数成比例的高斯过程,可确保函数输出的(α, β)-差分隐私。
  • 该方法为核密度估计提供了正式的隐私保障,支持发布可用于生成合成数据的私有化密度函数。
  • 对于核SVM,该方法可在保持其预测性能的同时对分类函数进行隐私化处理。
  • 在在线设置中,可利用矩阵求逆引理与指数核带来的稀疏性,高效计算新点处私有化函数的条件分布。
  • 计算复杂度随查询数量增长,但通过使用高效数据结构(如有序双向链表),可将每次查询的更新时间降至O(log i)。
  • 该框架具有通用性,适用于任何在Sobolev空间或RKHS中的函数,前提是其敏感性在RKHS范数下有界。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。