Skip to main content
QUICK REVIEW

[论文解读] Stealing Hyperparameters in Machine Learning

Binghui Wang, Neil Zhenqiang Gong|arXiv (Cornell University)|Feb 14, 2018
Adversarial Robustness in Machine Learning参考文献 51被引用 53
一句话总结

本文提出超参数窃取攻击,通过利用学习到的模型参数是(近似)极小值的性质,推断目标函数中使用的超参数,并给出一个在多种机器学习算法上具有理论与实证评估的通用框架。它还评估将取整作为防御的效果并讨论对策。

ABSTRACT

Hyperparameters are critical in machine learning, as different hyperparameters often result in models with significantly different performance. Hyperparameters may be deemed confidential because of their commercial value and the confidentiality of the proprietary algorithms that the learner uses to learn them. In this work, we propose attacks on stealing the hyperparameters that are learned by a learner. We call our attacks hyperparameter stealing attacks. Our attacks are applicable to a variety of popular machine learning algorithms such as ridge regression, logistic regression, support vector machine, and neural network. We evaluate the effectiveness of our attacks both theoretically and empirically. For instance, we evaluate our attacks on Amazon Machine Learning. Our results demonstrate that our attacks can accurately steal hyperparameters. We also study countermeasures. Our results highlight the need for new defenses against our hyperparameter stealing attacks for certain machine learning algorithms.

研究动机与目标

  • 出于交叉验证和专有算法的原因,激发对机器学习中超参数保密性的风险认识。
  • 提出一个从学习到的模型估计超参数的通用攻击框架。
  • 展示该框架如何应用于线性、核以及某些神经网络设置。
  • 提供对攻击有效性的理论保证和实证证据。
  • 评估基于取整的防御并讨论对跨算法的安全性影响。

提出的方法

  • 在学习到的参数处计算目标函数的梯度并设为零,以推导将超参数与模型参数联系起来的方程。
  • 从这些方程形成一个超定线性系统,并使用线性最小二乘法求解以估计超参数。
  • 通过相应地使用 w 或 alpha 向量区分非核与核算法的方法。
  • 通过使用可微维度/实例来形成 a 和 b 向量,从而解决不可微的问题。
  • 按需要将 a 向量扩展成矩阵,将框架扩展到多个超参数。

实验结果

研究问题

  • RQ1是否可以从学习到的模型参数准确恢复目标函数中的超参数?
  • RQ2攻击框架在线性、核及某些神经网络设置中的应用如何?
  • RQ3当学习到的参数是目标函数的精准极小值或近似极小值时,理论保证是什么?
  • RQ4将取整作为对抗超参数窃取的防御有多有效?
  • RQ5不同的正则化项与损失函数是否会影响对这些攻击的安全性属性?

主要发现

  • 当学习到的参数是确切极小值时,攻击可以准确恢复真实超参数。
  • 当学习到的参数接近极小值时,估计误差与它们的偏差成线性关系。
  • 该框架适用于岭回归、LASSO、核岭回归、SVM 变体、逻辑回归以及某些神经网络场景,在真实数据集上具有经验上的成功。
  • 对模型参数进行取整会增加估计误差,但在某些算法(如 LASSO)即使进行取整,攻击仍然有效。
  • 在取整情况下,L2 正则化比 L1 对这些攻击提供更好的安全性,且某些损失函数(交叉熵、平方铰损失)在防御方面优于铰损失。
  • 该工作强调需要超越简单取整的新的对策。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。