QUICK REVIEW

[論文レビュー] Starlit: Privacy-Preserving Federated Learning to Enhance Financial Fraud Detection

Aydin Abadi, B. A. Doyle|arXiv (Cornell University)|Jan 19, 2024

Privacy-Preserving Technologies in Data被引用数 6

ひとこと要約

Starlit は、完全同型暗号や固定したアカウント凍結の仮定に依存せずに、垂直・水平データ分割に対処する拡張性のあるプライバシー保護型連邦学習メカニズムで、金融詐欺検出を向上させます。

ABSTRACT

Federated Learning (FL) is a data-minimization approach enabling collaborative model training across diverse clients with local data, avoiding direct data exchange. However, state-of-the-art FL solutions to identify fraudulent financial transactions exhibit a subset of the following limitations. They (1) lack a formal security definition and proof, (2) assume prior freezing of suspicious customers' accounts by financial institutions (limiting the solutions' adoption), (3) scale poorly, involving either $O(n^2)$ computationally expensive modular exponentiation (where $n$ is the total number of financial institutions) or highly inefficient fully homomorphic encryption, (4) assume the parties have already completed the identity alignment phase, hence excluding it from the implementation, performance evaluation, and security analysis, and (5) struggle to resist clients' dropouts. This work introduces Starlit, a novel scalable privacy-preserving FL mechanism that overcomes these limitations. It has various applications, such as enhancing financial fraud detection, mitigating terrorism, and enhancing digital health. We implemented Starlit and conducted a thorough performance analysis using synthetic data from a key player in global financial transactions. The evaluation indicates Starlit's scalability, efficiency, and accuracy.

研究の動機と目的

詐欺検出を改善するために、金融機関間でコラボレーションしプライバシーを保護した分析の必要性を動機づける。
セキュリティ証明、スケーラビリティ、ドロップアウトとアイデンティティ整合の扱いなど、既存のFLソリューションの限界に対処する。
正式なセキュリティ定義と、垂直・水平に分割されたデータで機能する実用的でスケーラブルなプロトコル（Starlit）を提案する。
Starlit の実世界の金融詐欺シナリオおよびテロ資金対策やデジタルヘルスなど他の領域への適用可能性を示す。

提案手法

Starlit を紹介する。特徴抽出機（Feature Collector）を用いて訓練を二者間の垂直FL設定に単純化する、二段階のプライバシー保護型FLメカニズム。
共有ユーザ特徴間のアイデンティティ整列と差異検出のためにPrivate Set Intersectionを使用する。
トレーニングに使用される前にフラグ値をぼかすためにLocal Differential Privacyを組み込む。
フル同型暗号を用いず垂直FLフレームワーク内で訓練を行うためにSecureBoostを活用する。
受動的な敵に対してシミュレーションベースのセキュリティを備えた正式なセキュリティ定義（Celestial）を提供する。
Flowerで合成データを用いてStarlitを実装・評価し、スケーラビリティ・効率・精度を評価する。

実験結果

リサーチクエスチョン

RQ1Starlit は、敏感な入力を開示することなく、詐欺検出のための複数機関による垂直・水平データ協力を安全に実現できるか？
RQ2Starlit は参加者数の増加に対して線形スケーラビリティをどのように実現し、クライアントのドロップアウトにどう対処するか？
RQ3訓練中のプライバシー保護におけるPrivate Set Intersectionと Local Differential Privacyの役割と影響は何か？
RQ4効率的な暗号化モデル訓練を可能にするためにSecureBoostがStarlitフレームワークへどのように統合されるか？
RQ5シミュレーションベースのモデル（Celestial）の下でStarlitに対してどのような正式なセキュリティ保証を確立できるか？

主な発見

Starlit は参加者数に対して線形にスケールするように設計されており、完全同型暗号には依存しない。
フレームワークは、共有特徴の差異を安全に識別し、同じユーザの異なるクライアント間で共通の特徴を集約することを可能にする。
第三者のFeature Collectorを用いた二段階プロセス（特徴抽出と訓練）は、垂直・水平に分割されたデータでのスケーラブルな訓練を可能にする。
フラグに対してLocal Differential Privacyを適用し、モデル訓練中の推論リスクを低減する。
Starlit は大手世界的な金融取引組織の合成データで実装・評価され、スケーラビリティ、効率、精度の利点を示す。
本研究は正式なシミュレーションベースのセキュリティ定義（Celestial）を提供し、（V）FLワークフローでの漏洩を分析する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。