QUICK REVIEW

[论文解读] BLENDER: Enabling Local Search with a Hybrid Differential Privacy Model

Brendan Avent, Aleksandra Korolova|arXiv (Cornell University)|May 2, 2017

Privacy-Preserving Technologies in Data参考文献 29被引用 49

一句话总结

本文提出 BLENDER，一种混合差分隐私模型，结合本地差分隐私与可信管理员隐私模型，以提升本地搜索应用中的数据效用。通过利用愿意参与的用户获取高精度估计值，并利用客户端实现稳健的本地扰动，BLENDER 在两个大型搜索点击数据集上，于多种隐私预算下均实现了超过 95% 的 NDCG 得分。

ABSTRACT

We propose a hybrid model of differential privacy that considers a combination of regular and opt-in users who desire the differential privacy guarantees of the local privacy model and the trusted curator model, respectively. We demonstrate that within this model, it is possible to design a new type of blended algorithm for the task of privately computing the head of a search log. This blended approach provides significant improvements in the utility of obtained data compared to related work while providing users with their desired privacy guarantees. Specifically, on two large search click data sets, comprising 1.75 and 16 GB respectively, our approach attains NDCG values exceeding 95% across a range of privacy budget values.

研究动机与目标

解决大规模数据收集中用户隐私与数据效用之间的矛盾。
通过提升本地模型中的数据效用，使小型组织能够采用差分隐私。
设计一种混合隐私模型，以尊重用户对数据管理员不同信任水平的差异。
通过融合方法，在本地搜索日志构建中实现显著的效用提升。

提出的方法

将用户分为两组：使用本地差分隐私模型的‘客户端’，以及信任管理员的‘自愿参与’用户。
对客户端数据应用本地扰动，使用随机响应或类似机制以确保本地隐私。
使用可信管理员模型收集并发布来自自愿参与用户的扰动统计信息，以获得更高的数据保真度。
通过加权平均机制融合两组的估计值，优先考虑更准确的自愿参与组。
设计特定于应用的本地算法，以增强本地模型组件的效用。
基于方差和样本量优化融合权重，以最大化头部搜索日志的准确性。

实验结果

研究问题

RQ1结合本地与可信管理员模型是否能在不损害用户隐私保证的前提下提升差分隐私中的数据效用？
RQ2与纯本地或纯管理员方法相比，该混合模型在构建私有头部搜索日志时表现如何？
RQ3自愿参与组与客户端组的规模变化对融合输出效用有何影响？
RQ4该混合模型是否能支持用户规模较小的组织实现差分隐私的实用化部署？
RQ5如何优化融合过程以在保持差分隐私保证的同时最小化误差？

主要发现

BLENDER 在 1.75 GB 和 16 GB 的搜索点击数据集上，于多种隐私预算下均实现了超过 95% 的 NDCG 值。
融合机制有效利用了自愿参与组估计值的更高精度，同时为所有用户维持了强隐私保护。
与先前工作 [QYY+16] 相比，该混合模型在本地搜索日志构建的效用方面有显著提升。
尽管自愿参与组的估计值因样本量较小而更具变异性，但通过合理加权后，其在融合结果中仍具有实质性贡献。
该方法通过提升效用而不牺牲隐私，使用户规模较小的组织能够实现差分隐私的实用化部署。
该模型表明，结合基于信任的数据收集模型可在真实应用场景中带来显著的效用提升。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。