Skip to main content
QUICK REVIEW

[论文解读] Interpret Federated Learning with Shapley Values

Guan Wang|arXiv (Cornell University)|May 11, 2019
Privacy-Preserving Technologies in Data参考文献 15被引用 19
一句话总结

本文提出了一种基于Shapley值的垂直联邦学习隐私保护解释方法,通过为宿主方特征分配详细的特征重要性,同时为参与方特征提供统一的重要性评分,在保障模型可解释性的同时保护数据隐私。该方法确保参与方数据安全,同时提供对模型预测的可操作洞察。

ABSTRACT

Federated Learning is introduced to protect privacy by distributing training data into multiple parties. Each party trains its own model and a meta-model is constructed from the sub models. In this way the details of the data are not disclosed in between each party. In this paper we investigate the model interpretation methods for Federated Learning, specifically on the measurement of feature importance of vertical Federated Learning where feature space of the data is divided into two parties, namely host and guest. For host party to interpret a single prediction of vertical Federated Learning model, the interpretation results, namely the feature importance, are very likely to reveal the protected data from guest party. We propose a method to balance the model interpretability and data privacy in vertical Federated Learning by using Shapley values to reveal detailed feature importance for host features and a unified importance value for federated guest features. Our experiments indicate robust and informative results for interpreting Federated Learning models.

研究动机与目标

  • 解决在不损害参与方数据隐私的前提下解释垂直联邦学习模型的挑战。
  • 开发一种方法,为宿主方特征分配细粒度的特征重要性,同时保护参与方特征的隐私。
  • 在联邦学习环境中平衡模型可解释性与数据机密性。
  • 基于博弈论原理,提供一种统一的、隐私保护的联邦模型解释框架。

提出的方法

  • 使用Shapley值量化垂直联邦学习中的特征重要性,利用合作博弈论实现公平的特征归因。
  • 为宿主方的特征分配详细的Shapley值,以实现对单个预测的解释。
  • 对参与方所有特征应用统一的Shapley值,防止个体数据模式泄露。
  • 从在分布式数据上训练的子模型构建元模型,保持数据本地性和隐私性。
  • 在联邦学习流程中集成基于Shapley的解释方法,无需共享原始数据。
  • 采用对称聚合策略,确保特征重要性评分的公平性与一致性。

实验结果

研究问题

  • RQ1如何在保护敏感参与方特征的前提下,解释垂直联邦学习中的单个预测?
  • RQ2在不暴露原始参与方数据的情况下,如何最优地分配联邦学习中的特征重要性?
  • RQ3Shapley值能否被调整以在保持高可解释性的同时保护隐私?
  • RQ4与个体特征归因相比,统一的参与方特征重要性在保真度和隐私性方面表现如何?

主要发现

  • 所提出的方法在不泄露个体参与方特征的情况下,实现了稳健且富有信息量的解释结果。
  • Shapley值在宿主方和参与方之间均提供了公平且一致的特征重要性归因。
  • 统一的参与方特征重要性有效防止了数据泄露,同时保持了可解释性。
  • 实验表明,该方法在多种垂直联邦学习场景中均保持了高模型保真度和可解释性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。