Skip to main content
QUICK REVIEW

[論文レビュー] Towards Federated Graph Learning for Collaborative Financial Crimes Detection

Toyotaro Suzumura, Yi Zhou|arXiv (Cornell University)|Sep 19, 2019
Crime, Illicit Activities, and Governance被引用数 30
ひとこと要約

本論文は、複数の金融機関が生データを共有せずに、マネーロンダリングなどのグローバルな金融犯罪を共同で検出できるフェデレーテッドグラフ学習フレームワークを提案する。グラフニューラルネットワークとフェデレーテッドラーニングを組み合わせることで、UK FCA TechSprintデータセットを用いた実験で、ローカルモデル比でF1スコアが20%向上し、データプライバシーを保ちながら検出精度が向上することを示している。

ABSTRACT

Financial crime is a large and growing problem, in some way touching almost every financial institution. Financial institutions are the front line in the war against financial crime and accordingly, must devote substantial human and technology resources to this effort. Current processes to detect financial misconduct have limitations in their ability to effectively differentiate between malicious behavior and ordinary financial activity. These limitations tend to result in gross over-reporting of suspicious activity that necessitate time-intensive and costly manual review. Advances in technology used in this domain, including machine learning based approaches, can improve upon the effectiveness of financial institutions' existing processes, however, a key challenge that most financial institutions continue to face is that they address financial crimes in isolation without any insight from other firms. Where financial institutions address financial crimes through the lens of their own firm, perpetrators may devise sophisticated strategies that may span across institutions and geographies. Financial institutions continue to work relentlessly to advance their capabilities, forming partnerships across institutions to share insights, patterns and capabilities. These public-private partnerships are subject to stringent regulatory and data privacy requirements, thereby making it difficult to rely on traditional technology solutions. In this paper, we propose a methodology to share key information across institutions by using a federated graph learning platform that enables us to build more accurate machine learning models by leveraging federated learning and also graph learning approaches. We demonstrated that our federated model outperforms local model by 20% with the UK FCA TechSprint data set. This new platform opens up a door to efficiently detecting global money laundering activity.

研究の動機と目的

  • 個々の機関内での孤立した金融犯罪検出の限界を解消し、機関間連携による検出を可能にすること。
  • 金融機関間での取引データの直接共有を妨げるデータプライバシーおよび規制上の障壁を克服すること。
  • グラフベースの特徴とフェデレーテッドラーニングを活用した、スケーラブルでプライバシーを守る機械学習フレームワークを構築すること。
  • 実世界のベンチマークデータを用いて、フェデレーテッドグラフ学習がグローバルな金融犯罪パターンの検出にどのように有効であるかを実証すること。
  • 金融監督要件を満たす透明性と説明可能性を持つモデルを提供することで、規制適合を支援すること。

提案手法

  • 各金融機関が自らのデータでローカルモデルを学習し、生データを共有せずに中央でモデル重みを集約するフェデレーテッドラーニングアーキテクチャを採用する。
  • トポロジー的指標としてPageRankや局所的近傍(エゴネット)内の疑わしい参加者数を用いて、取引ネットワークからグラフ特徴を抽出する。
  • 2層の全結合シグモイド層と最終出力層にシグモイド関数を用いたニューラルネットワークを採用し、少数クラスのアンダーサンプリングによりバランスの取れたデータセット上でバイナリクロスエントロピー損失を最適化して学習する。
  • 6つの銀行と中央集約者からなるマルチ機関環境をシミュレートし、Truexら(2018)にインspiredされたフェデレーテッドラーニングプロトコルを用いる。
  • 実際のデータ分布を反映させるために、バランスの取れたローカルテストセットとアンバランスなグローバルテストセットの両方でモデル性能を評価する。
  • 実験では、ローカルモデル、グラフ特徴を含むローカルモデル、およびグローバルに集約されたフェデレーテッドモデルを比較し、協働学習の影響を明確に分離する。

実験結果

リサーチクエスチョン

  • RQ1生データを共有せずに、複数機関にまたがるフェデレーテッドグラフ学習が、金融犯罪検出の精度を向上させることができるか?
  • RQ2グラフベースのトポロジー的特徴の組み込みが、不審な金融行動の検出におけるモデル性能にどのように影響するか?
  • RQ3現実のアンバランスなデータセットにおいて、フェデレーテッドラーニングによる協働学習が、孤立したローカルモデル学習をどれほど上回るか?
  • RQ4規制およびデータプライバシー制約のもとで、プライバシーを守るフェデレーテッドラーニングフレームワークを、複雑な金融犯罪検出タスクに効果的に適用できるか?
  • RQ5実世界の状況を反映したアンバランスなデータセット上で、統合されたグローバルモデルの性能向上は、ローカルモデルと比べてどの程度か?

主な発見

  • フェデレーテッドグラフ学習モデルは、グローバルテストセットでF1スコア0.769を達成し、機関ごとのローカルモデル平均(F1スコア0.550)と比較して20%の向上を示した。
  • グラフ特徴をモデルに追加することで性能が顕著に向上し、機関ごとにF1スコアがグラフ特徴なし(0.550)からグラフ特徴あり(0.761~0.769)に上昇した。
  • バランスの取れたデータで学習したローカルモデルは、自身のテストセットでは高い精度(95%以上)を示したが、全アンバランスデータセットでの評価では性能が急激に低下(F1 ≈ 0.55)し、データアンバランスの課題が顕著に現れた。
  • 集約されたフェデレーテッドモデルは、アンバランスなグローバルテストセットでも高い性能(F1 = 0.769)を維持しており、機関間での協働学習の利点を示している。
  • トレーニングデータのバランス化のためのアンダーサンプリングにより、少数クラス(金融犯罪者)の一般化性能が向上し、そのラベルはアカウントの0.4%にしか割り当てられなかった。
  • 生データが機関間で共有されず、トレーニング中にモデルパラメータのみが交換されたことから、フレームワークはデータプライバシーを効果的に保護した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。