Skip to main content
QUICK REVIEW

[论文解读] XOR Mixup: Privacy-Preserving Data Augmentation for One-Shot Federated Learning

MyungJae Shin, Chihoon Hwang|arXiv (Cornell University)|Jun 9, 2020
Privacy-Preserving Technologies in Data参考文献 19被引用 57
一句话总结

XorMixFL 使用基于 XOR 的混合增广,在单次联邦学习设置下私密地跨设备增强数据,通过生成合成样本来在非 IID 情况下提升性能,同时保持隐私。

ABSTRACT

User-generated data distributions are often imbalanced across devices and labels, hampering the performance of federated learning (FL). To remedy to this non-independent and identically distributed (non-IID) data problem, in this work we develop a privacy-preserving XOR based mixup data augmentation technique, coined XorMixup, and thereby propose a novel one-shot FL framework, termed XorMixFL. The core idea is to collect other devices' encoded data samples that are decoded only using each device's own data samples. The decoding provides synthetic-but-realistic samples until inducing an IID dataset, used for model training. Both encoding and decoding procedures follow the bit-wise XOR operations that intentionally distort raw samples, thereby preserving data privacy. Simulation results corroborate that XorMixFL achieves up to 17.6% higher accuracy than Vanilla FL under a non-IID MNIST dataset.

研究动机与目标

  • 通过创建隐私保护的合成样本来解决联邦学习中的非 IID 数据分布问题。
  • 提出一个单次 FL 框架(XorMixFL),使用基于 XOR 的混合增广在不暴露原始样本的前提下扩增数据。
  • 在标签分布不均衡的情况下保持数据隐私,同时提高全局模型的准确性。

提出的方法

  • 引入 XorMixup,通过按位 XOR 对混合样本进行编码以在创建合成样本的同时保护原始数据。
  • 使用服务器端解码,结合其自身的基样本来生成更真实的增强数据。
  • 应用一个单次 FL 框架,设备上传编码样本,服务器解码以平衡标签分布,然后基于重构数据训练全局模型。
  • 结合 p 次样本混合和每个标签最多对 p 个样本进行平均,以提取共同特征并控制隐私/噪声。
  • 在非 IID MNIST 上将 XorMixFL 与 Vanilla FL 和 MixFL 进行对比,以评估精度与隐私权衡。

实验结果

研究问题

  • RQ1在单次 FL 设置中,基于 XOR 的混合增广(XorMixup)是否能提供隐私保护的数据增强?
  • RQ2在非 IID 数据分布下,XorMixFL 是否能在保持更高隐私(以样本相异度衡量)的同时提升相对 Vanilla FL 和 MixFL 的准确性?

主要发现

  • XorMixFL 在单次设置下在非 IID MNIST 上比 Vanilla FL 的准确率高出最多 17.6%。
  • 在同一非 IID 场景下,XorMixFL 可以比独立的 ML 高出约 8.13%。
  • 隐私度量(MDS)表明 XorMixFL 在测试配置中提供的样本隐私高于 MixFL。
  • 消融研究显示,采用基于 XOR 的编码/解码的 XorMixFL 在维持具竞争力的准确度的同时提供比 MixFL 更强的隐私。
  • 增加混合深度 p 和虚拟标签数 M 通常会提升隐私(MDS),并可能以可预测的方式影响准确性。
  • XorMixup 可以在提升隐私的同时达到与 MixFL 相当的准确性,证明基于 XOR 的增广在隐私保护的一次性 FL 中的价值。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。