QUICK REVIEW

[논문 리뷰] Starlit: Privacy-Preserving Federated Learning to Enhance Financial Fraud Detection

Aydin Abadi, B. A. Doyle|arXiv (Cornell University)|2024. 01. 19.

Privacy-Preserving Technologies in Data인용 수 6

한 줄 요약

Starlit는 수직 및 수평 데이터 분할에 대한 확장 가능한 프라이버시 보호 연합 학습 메커니즘으로, 완전 동형 암호화나 고정 계정 동결 가정에 의존하지 않고 금융 사기 탐지를 향상시킵니다.

ABSTRACT

Federated Learning (FL) is a data-minimization approach enabling collaborative model training across diverse clients with local data, avoiding direct data exchange. However, state-of-the-art FL solutions to identify fraudulent financial transactions exhibit a subset of the following limitations. They (1) lack a formal security definition and proof, (2) assume prior freezing of suspicious customers' accounts by financial institutions (limiting the solutions' adoption), (3) scale poorly, involving either $O(n^2)$ computationally expensive modular exponentiation (where $n$ is the total number of financial institutions) or highly inefficient fully homomorphic encryption, (4) assume the parties have already completed the identity alignment phase, hence excluding it from the implementation, performance evaluation, and security analysis, and (5) struggle to resist clients' dropouts. This work introduces Starlit, a novel scalable privacy-preserving FL mechanism that overcomes these limitations. It has various applications, such as enhancing financial fraud detection, mitigating terrorism, and enhancing digital health. We implemented Starlit and conducted a thorough performance analysis using synthetic data from a key player in global financial transactions. The evaluation indicates Starlit's scalability, efficiency, and accuracy.

연구 동기 및 목표

금융 기관들 간의 협력적이고 프라이버시를 보호하는 분석의 필요성을 제고하여 사기 탐지를 개선한다.
보안 증명, 확장성, 이탈 및 식별 일치 처리와 같은 기존 FL 솔루션의 한계를 다룬다.
수직 및 수평으로 분할된 데이터에서 작동하는 형식적 보안 정의와 실용적이고 확장 가능한 프로토콜(Starlit)을 제안한다.
실세계 금융 사기 시나리오와 테러 대책 및 디지털 건강과 같은 다른 도메인에 대한 Starlit's 적용 가능성을 입증한다.

제안 방법

Starlit를 도입하는 두 단계 프라이버시 보호 FL 메커니즘으로, Training을 두 당사자 수직 FL 설정으로 단순화하기 위해 Feature Collector를 사용한다.
공유된 사용자 특징 간의 아이덴티티 정렬 및 차이 탐지를 위해 Private Set Intersection을 사용한다.
학습에 사용되기 전에 플래그 값을 모호화하기 위해 Local Differential Privacy를 도입한다.
전체 동형 암호화 없이 수직 FL 프레임워크 내에서 학습을 위해 SecureBoost를 활용한다.
수동적 적대자에 대해 시뮬레이션 기반 보안을 갖춘 형식적 보안 정의(Celestial)를 제공한다.
합성 데이터를 사용하여 Flower에서 Starlit를 구현하고 평가하여 확장성, 효율성, 정확성을 평가한다.

실험 결과

연구 질문

RQ1Starlit가 민감한 입력을 노출하지 않고도 사기 탐지를 위한 다당사 수직 및 수평 데이터 협력을 안전하게 가능하게 할 수 있는가?
RQ2Starlit가 참가자 수에 따라 선형 확장성을 달성하고 클라이언트 이탈에 저항하는 방식은?
RQ3학습 중 프라이버시를 보존하는 데 있어 Private Set Intersection과 Local Differential Privacy의 역할과 영향은?
RQ4SecureBoost가 Starlit 프레임워크에 어떻게 통합되어 효율적이고 암호화된 모델 학습을 가능하게 하는가?
RQ5시뮬레이션 기반 모델(Celestial) 하에서 Starlit에 대해 어떤 형식적 보안 보장이 확립될 수 있는가?

주요 결과

Starlit는 참가자 수에 따라 선형으로 확장되도록 설계되었으며, 전체 동형 암호화에 의존하지 않는다.
이 프레임워크는 같은 사용자의 공유 특징 간 차이를 안전하게 식별하고 서로 다른 클라이언트 간 공통 특징의 집계를 가능하게 한다.
제 3자 Feature Collector를 포함한 두 단계 프로세스(특징 추출 및 학습)는 수직 및 수평으로 분할된 데이터에서 확장 가능한 학습을 가능하게 한다.
로컬 차등 프라이버시가 플래그에 적용되어 모델 학습 중 추론 위험을 줄인다.
Starlit는 글로벌 주요 금융 거래 조직의 합성 데이터를 사용하여 구현 및 평가되어 확장성, 효율성, 정확도 이점을 보인다.
이 연구는 형식적 시뮬레이션 기반 보안 정의(Celestial)를 제공하고 (V)FL 워크플로우의 누설을 분석한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.