Skip to main content
QUICK REVIEW

[論文レビュー] Transfer Learning without Knowing: Reprogramming Black-box Machine Learning Models with Scarce Data and Limited Resources

Yun Yun Tsai, Pin‐Yu Chen|arXiv (Cornell University)|Jul 17, 2020
Cell Image Analysis Techniques被引用数 28
ひとこと要約

本稿では、アーキテクチャやパラメータにアクセスできないプリトレーニング済みブラックボックスMLモデル(APIや特許ソフトウェアなど)を、アーキテクチャやパラメータの情報なしに再プログラミングする、新しい転移学習手法であるブラックボックス敵対的再プログラミング(BAR)を提案する。ゼロ番目の最適化とマルチラベルマッピングを活用することで、ホワイトボックス敵対的再プログラミングと同等の性能を達成し、特にデータが限られる医療画像診断タスクにおいて、標準的なファインチューニングを上回る。

ABSTRACT

Current transfer learning methods are mainly based on finetuning a pretrained model with target-domain data. Motivated by the techniques from adversarial machine learning (ML) that are capable of manipulating the model prediction via data perturbations, in this paper we propose a novel approach, black-box adversarial reprogramming (BAR), that repurposes a well-trained black-box ML model (e.g., a prediction API or a proprietary software) for solving different ML tasks, especially in the scenario with scarce data and constrained resources. The rationale lies in exploiting high-performance but unknown ML models to gain learning capability for transfer learning. Using zeroth order optimization and multi-label mapping techniques, BAR can reprogram a black-box ML model solely based on its input-output responses without knowing the model architecture or changing any parameter. More importantly, in the limited medical data setting, on autism spectrum disorder classification, diabetic retinopathy detection, and melanoma detection tasks, BAR outperforms state-of-the-art methods and yields comparable performance to the vanilla adversarial reprogramming method requiring complete knowledge of the target ML model. BAR also outperforms baseline transfer learning approaches by a significant margin, demonstrating cost-effective means and new insights for transfer learning.

研究の動機と目的

  • プリトレーニング済みモデルの内部構造やパラメータへの完全なアクセスを必要とする現在の転移学習手法の制限を解消すること。
  • データが限られ、計算リソースが制限される状況でも効果的な転移学習を可能にすること。
  • 入力出力応答のみが観測可能な、モデル内部構造が不明なブラックボックス環境への敵対的再プログラミングの拡張。
  • ファインチューニングやモデルの内部調査なしに、強力なプリトレーニングモデルを新しいタスクに再利用可能であることを実証すること。
  • プライバシーが重要な分野やアクセス制限がある分野(例:医療分野)において、高パフォーマンスなMLをコスト効率よく展開する実用的で費用対効果の高いソリューションを提供すること。

提案手法

  • モデルのアーキテクチャやパラメータにアクセスできない状況でも、入力出力応答からの勾配推定が可能なゼロ番目の最適化(ZOO)を用いることで、最適化を実現する。
  • ソースドメイン(例:ImageNet)とターゲットドメイン(例:医療)のラベルを一致させるためにマルチラベルマッピングを採用し、ラベル転送の効率を向上させる。
  • 周波数に基づくラベルマッピングを適用し、主要なターゲットクラスにより代表的なソースラベルを割り当てることで、収束性とパフォーマンスを向上させる。
  • 交差エントロピー損失に加え、ファーコス損失を最適化中に使用することで、不均衡なデータや分類が難しいサンプルに対しても学習ダイナミクスを改善する。
  • 入力に一様な摂動を学習させることでブラックボックスモデルを再プログラミングし、モデルの予測をターゲットタスクに一致させる。
  • 実世界のAPIおよびプリトレーニング済みモデルを用いて手法を検証し、実用的制約下でも実現可能性と頑健性を示している。

実験結果

リサーチクエスチョン

  • RQ1内部構造やパラメータにアクセスできないブラックボックスMLモデルにおいて、効果的な転移学習が可能かどうか。
  • RQ2ラベル付きデータが限られる医療画像診断のようなデータが限られる状況下で、敵対的再プログラミングはどの程度の性能を示すか。
  • RQ3ゼロ番目の最適化がブラックボックスモデルの再プログラミングにおいてバックプロパゲーションを効果的に置き換えられるか。
  • RQ4異なるラベルマッピング戦略(ランダム vs. 周波数ベース)がモデルのパフォーマンスと収束に与える影響は何か。
  • RQ5損失関数の選択(例:ファーコス損失 vs. 交差エントロピー)がブラックボックス敵対的再プログラミングのパフォーマンスに与える影響は何か。

主な発見

  • BARはモデルの内部構造にアクセスできないにもかかわらず、ホワイトボックス敵対的再プログラミングベースラインと比較して3–5%以内のテスト精度を達成した。
  • 自閉症スペクトラム障害(ASD)、糖尿病網膜症(DR)、メラノーマ検出タスクにおいて、BARは最先端の転移学習手法および標準的なファインチューニングを大きく上回った。
  • 周波数ベースのマルチラベルマッピングは、すべてのタスクにおいてランダムマッピングと比較して収束速度を向上させ、テスト精度を3–5%向上させた。
  • ファーコス損失は収束をより速くし、特に不均衡な医療データセットにおいて、交差エントロピー損失と比較してBARのパフォーマンスを3–5%向上させた。
  • t-SNE可視化により、ファインチューニングよりもBARがより判別力があり、明確に分離された特徴表現を学習していることが確認され、優れた表現学習が実現されていることが示された。
  • 最小限の計算コストで実世界のオンライン画像分類APIを効果的に再プログラミングでき、実用的展開の可能性を実証した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。