[논문 리뷰] A Privacy-Preserving Hybrid Federated Learning Framework for Financial Crime Detection
본 논문은 보안 특징 추출과 노이즈 기반 보호를 갖춘 프라이버시 인식 하이브드(수직+수평) 연합학습 프레임워크인 HyFL를 금융 범죄 탐지를 위해 제안하고, 합성 SWIFT 데이터로 평가된다.
The recent decade witnessed a surge of increase in financial crimes across the public and private sectors, with an average cost of scams of $102m to financial institutions in 2022. Developing a mechanism for battling financial crimes is an impending task that requires in-depth collaboration from multiple institutions, and yet such collaboration imposed significant technical challenges due to the privacy and security requirements of distributed financial data. For example, consider the modern payment network systems, which can generate millions of transactions per day across a large number of global institutions. Training a detection model of fraudulent transactions requires not only secured transactions but also the private account activities of those involved in each transaction from corresponding bank systems. The distributed nature of both samples and features prevents most existing learning systems from being directly adopted to handle the data mining task. In this paper, we collectively address these challenges by proposing a hybrid federated learning system that offers secure and privacy-aware learning and inference for financial crime detection. We conduct extensive empirical studies to evaluate the proposed framework's detection performance and privacy-protection capability, evaluating its robustness against common malicious attacks of collaborative learning. We release our source code at https://github.com/illidanlab/HyFL .
연구 동기 및 목표
- 다수 기관 간의 협력적이면서도 프라이버시를 보호하는 금융 범죄 탐지의 필요성을 동기화한다.
- 거래 데이터와 계정 데이터를 활용하기 위해 수직 FL과 수평 FL을 결합하는 새로운 HyFL 프레임워크를 제안한다.
- 모델 역추론, 속성 추론, 멤버십 추론에 대한 프라이버시 위험과 방어 메커니즘을 평가한다.
- 대규모 합성 데이터에서 프레임워크의 효과성과 프라이버시-유용성의 균형을 입증한다.
제안 방법
- 거래 클라이언트, 다수의 계정 클라이언트, 중앙 서버의 세 가지 유형 처리 노드로 구성된 HyFL 아키텍처를 도입한다.
- 계정 클라이언트와 거래 클라이언트 사이의 수직 FL를 사용하여 계정 유래 특징과 거래 특징을 융합한다.
- 계정 데이터에서 자동인코더를 학습시켜 특징 임베딩을 생성한 다음, 임베딩과 거래 특징을 연결해 최종 예측에 사용한다.
- 학습 및 추론 중 프라이버시 공격에 대비하기 위해 연결된 특징에 가우시안 노이즈를 적용한다.
- 모델 매개변수를 암호화하고 특징 추출기를 사용해 속성 누출과 모델 역추론으로부터 보호한다.
- (i) 자동인코더를 이용한 특징 학습, (ii) 특징 추출, (iii) 프라이버시 보호를 갖춘 분류기 학습의 세 단계 학습 파이프라인을 제공한다.
실험 결과
연구 질문
- RQ1수직-수평 FL 하이브리드 프레임워크가 데이터 프라이버시를 보장하면서도 효과적인 금융 범죄 탐지를 어떻게 가능하게 할 수 있는가?
- RQ2HyFL 학습 및 추론에서 어떤 프라이버시 위험이 발생하며, 암호화, 차등 프라이버시, 노이즈 주입이 이를 어떻게 완화할 수 있는가?
- RQ3계정 유래 임베딩과 거래 특징의 결합이 프라이버시 제약하에서 탐지 성능에 미치는 영향은 무엇인가?
주요 결과
- HyFL은 가우시안 노이즈 및 암호화된 매개변수 집계를 통해 프라이버시 보호를 균형 있게 유지하면서 강한 탐지 성능을 달성한다.
- 프레임워크는 노이즈, 인코더, 암호화를 조합해 모델 역추론, 멤버십 추론, 속성 추론 및 특징 누출 위험을 완화한다.
- 합성 SWIFT 데이터셋에서 최대 200명의 계정 클라이언트까지 확장 가능하며 XGBoost를 분류기로 활용하는 것을 보여준다.
- 일반 HyFL과 프라이버시 강화 HyFL 두 가지를 지원하며, 후자는 보안을 강화하는 대가로 약간의 유용성을 트레이드오프한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.