QUICK REVIEW

[論文レビュー] Adversarial Reprogramming of Sequence Classification Neural Networks.

Paarth Neekhara, Shehzeen Hussain|arXiv (Cornell University)|Sep 6, 2018

Adversarial Robustness in Machine Learning被引用数 5

ひとこと要約

本稿では、入力空間が離散的である自然言語処理のような文脈において、元のモデルを変更せずにLSTM、BiLSTM、CNNなどの事前学習済みシーケンス分類ネットワークを新たなテキスト分類タスクに敵対的再プログラミングするための文脈ベースの語彙リマッピングモデルを提案する。白색ボックスおよびブラックボックス設定の両方で離散的入力変換を学習することで、高い精度でターゲットタスクに再利用可能なモデルを実現し、自然言語のような離散的入力空間における可能性を示した。

ABSTRACT

Adversarial Reprogramming has demonstrated success in utilizing pre-trained neural network classifiers for alternative classification tasks without modification to the original network. An adversary in such an attack scenario trains an additive contribution to the inputs to repurpose the neural network for the new classification task. While this reprogramming approach works for neural networks with a continuous input space such as that of images, it is not directly applicable to neural networks trained for tasks such as text classification, where the input space is discrete. Repurposing such classification networks would require the attacker to learn an adversarial program that maps inputs from one discrete space to the other. In this work, we introduce a context-based vocabulary remapping model to reprogram neural networks trained on a specific sequence classification task, for a new sequence classification task desired by the adversary. We propose training procedures for this adversarial program in both white-box and black-box settings. We demonstrate the application of our model by adversarially repurposing various text-classification models including LSTM, bi-directional LSTM and CNN for alternate classification tasks.

研究の動機と目的

入力空間が離散的である、たとえばテキスト分類のようなシーケンス分類タスクにおいて、ニューラルネットワークを新たなタスクに再プログラミングする課題に対処すること。
従来の加法的入力摂動が失敗する離散的入力空間において、敵対的再プログラミングを可能にする手法を開発すること。
入力を1つの離散的空間から別の離散的空間へ変換する文脈に依存する語彙リマッピング機構を設計すること。
白色ボックスおよびブラックボックス設定の両方における敵対的プログラムのトレーニング手順を提供すること。
LSTM、BiLSTM、CNNアーキテクチャを含む多様なシーケンスモデルに対して、本手法の有効性を実証的に検証すること。

提案手法

ソースの離散的空間からターゲットの離散的空間にシーケンスを変換する文脈ベースの語彙リマッピングモデルを提案する。
文脈に基づいて語やトークンを代替表現にマッピングする微分可能変換機構を設計し、効果的な再プログラミングを可能にする。
二段階のトレーニングプロセスを採用する：まず、入力分布をターゲットタスクの要件に一致させるためにリマッピング関数をトレーニングし、次に、ターゲットタスクの精度を最大化するためにモデルをファインチューニングする。
ターゲットモデルの勾配へのアクセスがあるか、予測結果のみの可視性があるかに応じて、トレーニング目的を調整することで、白色ボックスおよびブラックボックス設定を両方サポートする。
アテンションメカニズムや文脈に依存する埋め込みを用いて、リマッピング中に意味的整合性を保つ。これにより、変換後の入力が意味的に整合的であることを保証する。
事前学習済み分類器にリマップされた入力を適用することで、元のネットワークを再トレーニングせずに、新たな分類タスクに再利用可能にする。

実験結果

リサーチクエスチョン

RQ1加法的摂動が不適切な離散的入力空間、たとえばテキストのような環境において、敵対的再プログラミングを効果的に拡張できるか？
RQ21つの離散的分類タスクから別のタスクに変換する文脈に依存する語彙リマッピング関数をどのように設計できるか？
RQ3白色ボックスおよびブラックボックス設定の両方で、シーケンスモデルの成功した再プログラミングを可能にするトレーニング戦略は何か？
RQ4LSTM、BiLSTM、CNNのような事前学習済みシーケンスモデルが、本手法を用いて新たな分類タスクにどの程度再利用可能か？
RQ5再プログラミングされたモデルの性能は、同じデータでファインチューニングされたモデルと比べてどの程度か？

主な発見

提案された語彙リマッピングモデルは、ブラックボックス設定でさえも、高い精度で事前学習済みシーケンス分類器を新たなテキスト分類タスクに再プログラミングすることに成功した。
本手法はターゲットタスクで競争力のある性能を達成し、同じデータでファインチューニングされたモデルと同等またはそれ以上の精度に近づいた。
文脈に依存するリマッピングにより意味的整合性が保たれ、離散的入力空間の制約下でも意味の伝達が効果的に行えるようになった。
本手法はLSTM、BiLSTM、CNNを含む多様なアーキテクチャに有効であり、一般化可能性を示した。
白色ボックス設定ではブラックボックス設定よりも高い成功率を達成したが、両者ともターゲットタスクで顕著な性能を示した。
結果から、加法的摂動ではなく、構造的な語彙変換を用いることで、離散的シーケンス空間における敵対的再プログラミングが可能であることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。