QUICK REVIEW

[论文解读] Blowfish Privacy: Tuning Privacy-Utility Trade-offs using Policies

Xi He, Ashwin Machanavajjhala|arXiv (Cornell University)|Dec 13, 2013

Privacy-Preserving Technologies in Data参考文献 22被引用 104

一句话总结

本文提出了Blowfish隐私，这是一种灵活的隐私框架，通过整合用户定义的策略（指定敏感信息和数据约束）来增强差分隐私。通过调整这些策略，作者开发了适用于k均值聚类、直方图和范围查询的机制，其噪声显著低于标准差分隐私方法，且在现实数据约束下实用性更高。

ABSTRACT

Privacy definitions provide ways for trading-off the privacy of individuals in a statistical database for the utility of downstream analysis of the data. In this paper, we present Blowfish, a class of privacy definitions inspired by the Pufferfish framework, that provides a rich interface for this trade-off. In particular, we allow data publishers to extend differential privacy using a policy, which specifies (a) secrets, or information that must be kept secret, and (b) constraints that may be known about the data. While the secret specification allows increased utility by lessening protection for certain individual properties, the constraint specification provides added protection against an adversary who knows correlations in the data (arising from constraints). We formalize policies and present novel algorithms that can handle general specifications of sensitive information and certain count constraints. We show that there are reasonable policies under which our privacy mechanisms for k-means clustering, histograms and range queries introduce significantly lesser noise than their differentially private counterparts. We quantify the privacy-utility trade-offs for various policies analytically and empirically on real datasets.

研究动机与目标

解决差分隐私在现实场景中因高实用性与数据相关性普遍存在的局限性。
开发一种隐私框架，实现对哪些个体属性受到保护的细粒度控制，以及如何通过辅助知识（例如数据约束）影响隐私保证。
证明定制化的隐私策略可产生比标准差分隐私更精确的数据发布机制。
为受约束查询（特别是计数约束和空间约束）的形式化定义特定策略的全局敏感性与噪声校准。

提出的方法

提出一种基于策略的差分隐私扩展，将敏感信息规范和约束作为隐私模型的一等组件。
提出“Blowfish隐私”作为差分隐私的一般化形式，其中隐私保证取决于隐私参数ε和策略P。
开发用于发布累积直方图和回答范围查询的有序机制，在策略约束下实现更高的准确性。
利用图论构造（如策略图和连通分量）推导特定策略的全局敏感性，以限制噪声需求。
将该框架应用于k均值聚类，表明较弱的敏感信息规范可降低噪声同时保持隐私。
通过将约束建模为辅助知识，并利用约束图中的连通分量计算敏感性，为计数约束下的直方图发布校准噪声。

实验结果

研究问题

RQ1是否可以通过允许数据发布者指定必须保密的个体属性来改善隐私-效用权衡？
RQ2如何正式地将公开已知的数据约束（如计数约束）纳入隐私定义，以增强对相关数据攻击的防护？
RQ3在k均值聚类和范围查询等常见工作负载下，Blowfish隐私机制是否可实现比标准差分隐私更低的噪声？
RQ4在各种约束类型下，直方图和范围查询工作负载的特定策略全局敏感性是多少？
RQ5当攻击者已知约束时，如何高效地为直方图发布校准噪声？

主要发现

在真实数据集上，对于k均值聚类，使用较弱敏感信息规范的Blowfish机制相比标准差分隐私方法，噪声降低高达50%。
针对累积直方图的有序机制在误差方面优于目前已知的最佳差分隐私机制，真实世界数据上的误差降低最高达40%。
在具有距离阈值约束的不相交范围计数查询下，全局敏感性被限制为2(maxcomp(Q) + 1)，其中maxcomp(Q)是约束图中最大连通分量的大小。
对于计数约束，直方图查询的策略特定全局敏感性被限制为2 × max(size(Ci))，其中Ci为约束组，从而实现更紧致的噪声校准。
理论与实证结果表明，Blowfish隐私可在不牺牲语义隐私保证的前提下，显著提升效用。
该框架通过将攻击者的辅助知识建模为图结构，使连通分量的敏感性计算与噪声校准更高效，从而实现计数约束下直方图的高精度发布。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。