QUICK REVIEW

[論文レビュー] ProPILE: Probing Privacy Leakage in Large Language Models

Siwon Kim, Sangdoo Yun|arXiv (Cornell University)|Jul 4, 2023

Topic Modeling被引用数 21

ひとこと要約

ProPILEは、個人データに基づくプロンプトを作成し、再構成の可能性と正確な一致を測定することにより、データ主体と提供者がLLMにおける潜在的なPII漏洩を評価できるプロービングツールです。

ABSTRACT

The rapid advancement and widespread use of large language models (LLMs) have raised significant concerns regarding the potential leakage of personally identifiable information (PII). These models are often trained on vast quantities of web-collected data, which may inadvertently include sensitive personal data. This paper presents ProPILE, a novel probing tool designed to empower data subjects, or the owners of the PII, with awareness of potential PII leakage in LLM-based services. ProPILE lets data subjects formulate prompts based on their own PII to evaluate the level of privacy intrusion in LLMs. We demonstrate its application on the OPT-1.3B model trained on the publicly available Pile dataset. We show how hypothetical data subjects may assess the likelihood of their PII being included in the Pile dataset being revealed. ProPILE can also be leveraged by LLM service providers to effectively evaluate their own levels of PII leakage with more powerful prompts specifically tuned for their in-house models. This tool represents a pioneering step towards empowering the data subjects for their awareness and control over their own data on the web.

研究の動機と目的

ウェブ規模のLLM訓練データに含まれるPIIからプライバシー上の懸念を動機づける。
データ主体が展開済みLLMサービスにおける自分のPIIの潜在的な漏洩を評価するためのツールを提供する。
サービス提供者がモデルアクセスとプロンプトを用いて漏洩を評価・緩和するホワイトボックスのプロービング経路を提供する。
構造化PIIと非構造化PIIの違いを区別し、それらの漏洩特性を研究する。

提案手法

PIIのリンク性と構造性を定義して漏洩評価を導く。
black-boxプロービングを提案する：K個のテンプレートとN回のクエリを用いて対象PIIの漏洩可能性を評価するプロンプトを生成する。
white-boxプロービングを提案する：小さな訓練データセットを用いたソフトプロンプトチューニングで対象PIIの再構成可能性を最大化する。
プロンプト条件の下での厳密な文字列一致と再構成可能性Pr(a_m|A extbackslash m)を用いて漏洩を定量化する。
Pileデータセットで訓練されたOPT-1.3Bモデルを評価し、PII漏洩パターンを明らかにする。
関連モデル間で学習済みソフトプロンプトの移植性を検証する。

実験結果

リサーチクエスチョン

RQ1データ主体は、プロンプトを巧みに設計することで自分のPIIがLLMによって漏洩する可能性を検出できるか。
RQ2プロンプト設計（ブラックボックス）はPIIの漏洩可能性と厳密な再構成にどのように影響するか。
RQ3ソフトプロンプトを用いたホワイトボックスプロービングは、より厳密な最悪ケースの漏洩状況を明らかにできるか。
RQ4漏洩はモデルサイズ、プロンプトの複雑さ、およびプロンプトチューニングの利用可能な訓練データ量とともにスケールするか。
RQ5異なるモデル間で漏洩を促進するプロンプトの移植性はあるか。

主な発見

戦略的に設計されたプロンプトを用いることで、多様なPIIタイプの大部分が開示され得る。
プロンプトの洗練、モデルパラメータへのアクセス、数百の訓練例により、漏洩可能性は高まる。
ソフトプロンプトチューニングによるホワイトボックスプロービングはブラックボックスプロンプトよりも高い漏洩をもたらし、限られたデータでも厳密一致を測定可能な場合がある。
モデルが大きく、より表現力のあるプロンプトを用いると、漏洩可能性と厳密一致率は上昇する。
一つのモデルで学習したソフトプロンプトは他のモデルへ部分的に移植され、ターゲットの漏洙可能性を高めうる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。