QUICK REVIEW

[论文解读] Transfer Learning without Knowing: Reprogramming Black-box Machine Learning Models with Scarce Data and Limited Resources

Yun Yun Tsai, Pin‐Yu Chen|arXiv (Cornell University)|Jul 17, 2020

Cell Image Analysis Techniques被引用 28

一句话总结

本文提出黑盒对抗重编程（BAR），一种新颖的迁移学习方法，可在无法访问其架构或参数的情况下，对预训练的黑盒机器学习模型（如API或专有软件）进行重编程。通过利用零阶优化和多标签映射，BAR在性能上达到与白盒对抗重编程相当的水平，并在数据稀缺的医学影像任务中超越标准微调方法。

ABSTRACT

Current transfer learning methods are mainly based on finetuning a pretrained model with target-domain data. Motivated by the techniques from adversarial machine learning (ML) that are capable of manipulating the model prediction via data perturbations, in this paper we propose a novel approach, black-box adversarial reprogramming (BAR), that repurposes a well-trained black-box ML model (e.g., a prediction API or a proprietary software) for solving different ML tasks, especially in the scenario with scarce data and constrained resources. The rationale lies in exploiting high-performance but unknown ML models to gain learning capability for transfer learning. Using zeroth order optimization and multi-label mapping techniques, BAR can reprogram a black-box ML model solely based on its input-output responses without knowing the model architecture or changing any parameter. More importantly, in the limited medical data setting, on autism spectrum disorder classification, diabetic retinopathy detection, and melanoma detection tasks, BAR outperforms state-of-the-art methods and yields comparable performance to the vanilla adversarial reprogramming method requiring complete knowledge of the target ML model. BAR also outperforms baseline transfer learning approaches by a significant margin, demonstrating cost-effective means and new insights for transfer learning.

研究动机与目标

解决当前迁移学习方法需要完全访问并修改预训练模型的局限性。
在数据稀缺且计算资源受限的场景中实现有效的迁移学习。
将对抗重编程扩展至仅能观测输入-输出响应的黑盒设置。
证明强大的预训练模型可在无需微调或模型检查的情况下被重新用于新任务。
为医疗等隐私敏感或访问受限领域提供一种成本低廉、实用的高性能机器学习部署方案。

提出的方法

利用零阶优化（ZOO）从输入-输出响应中估计梯度，实现在无需访问模型架构或参数情况下的优化。
采用多标签映射将源域（如ImageNet）和目标域（如医学）的类别标签对齐，提升标签迁移效率。
应用基于频率的标签映射，为占主导地位的目标类别分配更具代表性的源类别标签，从而提升收敛速度和性能。
在优化过程中同时使用交叉熵损失和焦点损失，以改善学习动态，尤其适用于类别不平衡或难以分类的样本。
通过学习一种对输入的通用扰动，实现对黑盒模型的重编程，使模型的预测结果与目标任务对齐。
在真实世界的API和预训练模型上验证该方法，证明其在实际约束条件下的可行性与鲁棒性。

实验结果

研究问题

RQ1是否可以在不访问模型内部结构或参数的情况下，有效对黑盒机器学习模型执行迁移学习？
RQ2在数据稀缺的场景（如医学影像）中，对抗重编程的性能如何，尤其是在标注数据有限的情况下？
RQ3零阶优化是否能有效替代黑盒模型重编程中的反向传播？
RQ4不同的标签映射策略（随机映射与基于频率的映射）对模型性能和收敛性有何影响？
RQ5损失函数的选择（如焦点损失与交叉熵损失）如何影响黑盒对抗重编程的性能？

主要发现

尽管无法访问模型内部结构，BAR的测试准确率仍与白盒对抗重编程基线相差仅3–5%。
在自闭症谱系障碍（ASD）、糖尿病视网膜病变（DR）和黑色素瘤检测任务中，BAR显著优于最先进迁移学习方法和标准微调方法。
与随机映射相比，基于频率的多标签映射在所有任务中均提升了3–5%的测试准确率，并加快了收敛速度。
与交叉熵损失相比，焦点损失使BAR的收敛速度更快，并在类别不平衡的医学数据集中将性能提升3–5%。
t-SNE可视化结果表明，BAR学习到的特征表示更具判别性且类别间分离更清晰，表明其具有更优的表示学习能力。
该方法成功在真实世界在线图像分类API上实现重编程，计算成本极低且无需访问模型，证明了其实际可部署性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。