[论文解读] Restricted Local Differential Privacy for Distribution Estimation with High Data Utility.
本文提出了一种新型框架——效用优化的本地差分隐私(ULDP),该框架仅对非敏感数据减少噪声,同时对敏感数据保持强隐私保护,相较于标准LDP机制显著提升了数据效用——尤其当大多数数据为非敏感时,其效用在低隐私环境下可接近非私有机制的水平。
LDP (Local Differential Privacy) has been widely studied to estimate statistics of personal data (e.g., distribution underlying the data) while protecting users' privacy. Although LDP does not require a trusted third party, it regards all personal data equally sensitive, which causes excessive obfuscation hence the loss of utility. In this paper, we introduce the notion of ULDP (Utility-optimized LDP), which provides a privacy guarantee equivalent to LDP only for sensitive data. We first consider the setting where all users use the same obfuscation mechanism, and propose two mechanisms providing ULDP: utility-optimized randomized response and utility-optimized RAPPOR. We then consider the setting where the distinction between sensitive and non-sensitive data can be different from user to user. For this setting, we propose a personalized ULDP mechanism with semantic tags to estimate the distribution of personal data with high utility while keeping secret what is sensitive for each user. We show theoretically and experimentally that our mechanisms provide much higher utility than the existing LDP mechanisms when there are a lot of non-sensitive data. We also show that when most of the data are non-sensitive, our mechanisms even provide almost the same utility as non-private mechanisms in the low privacy regime.
研究动机与目标
- 为解决标准本地差分隐私(LDP)的低效问题,后者对所有数据统一添加噪声,无论其敏感性如何,导致效用损失过大。
- 设计一种机制,仅对敏感数据提供强隐私保护,同时最小化对非敏感数据的混淆。
- 实现个性化隐私保护,使用户可自行定义其敏感数据,从而在不损害隐私的前提下提升效用。
- 从理论上和实证上证明,ULDP在大多数数据为非敏感时,其效用高于现有LDP机制。
提出的方法
- 提出效用优化的随机化响应,一种根据数据敏感性调整噪声注入的机制,从而提升非敏感数据的效用。
- 提出效用优化的RAPPOR,即RAPPOR的一种变体,通过优化混淆过程,在保持敏感数据隐私的同时提升效用。
- 设计一种使用语义标签的个性化ULDP机制,使用户可单独标记敏感数据,实现用户特定的噪声分配。
- 采用隐私预算分配策略,仅对敏感数据分配更高的隐私保护,从而减少总体噪声。
- 使用一种利用非敏感数据结构的分布估计框架,以提高估计精度。
- 结合理论分析与实证评估,在不同数据敏感性比例下,将ULDP的效用与标准LDP机制进行对比。
实验结果
研究问题
- RQ1我们能否设计一种本地差分隐私机制,在减少非敏感数据噪声的同时,对敏感数据保持强隐私保护?
- RQ2当非敏感数据比例较高时,ULDP的效用与标准LDP机制相比如何?
- RQ3个性化敏感性标记能否在不降低隐私保障的前提下提升数据效用?
- RQ4在低隐私环境下,ULDP在多大程度上可接近非私有机制的效用?
主要发现
- 当大部分数据为非敏感时,ULDP机制的效用显著高于标准LDP机制。
- 在低隐私环境下,当大多数数据为非敏感时,ULDP的效用可接近非私有机制的水平。
- 使用语义标签的个性化ULDP机制实现了细粒度的隐私控制,同时保持了高估计精度。
- 效用优化的随机化响应与RAPPOR通过减少非敏感数据的噪声,提升了分布估计性能。
- 理论与实验结果证实,ULDP仅对敏感数据提供与LDP相当的隐私保护,且不损害整体隐私保证。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。