[논문 리뷰] Year-over-Year Developments in Financial Fraud Detection via Deep Learning: A Systematic Literature Review
A Kitchenham-based systematic review of deep learning for financial fraud detection, analyzing 57 studies (2019–2024) across sectors, models, preprocessing, and privacy considerations.
This paper systematically reviews advancements in deep learning (DL) techniques for financial fraud detection, a critical issue in the financial sector. Using the Kitchenham systematic literature review approach, 57 studies published between 2019 and 2024 were analyzed. The review highlights the effectiveness of various deep learning models such as Convolutional Neural Networks, Long Short-Term Memory, and transformers across domains such as credit card transactions, insurance claims, and financial statement audits. Performance metrics such as precision, recall, F1-score, and AUC-ROC were evaluated. Key themes explored include the impact of data privacy frameworks and advancements in feature engineering and data preprocessing. The study emphasizes challenges such as imbalanced datasets, model interpretability, and ethical considerations, alongside opportunities for automation and privacy-preserving techniques such as blockchain integration and Principal Component Analysis. By examining trends over the past five years, this review identifies critical gaps and promising directions for advancing DL applications in financial fraud detection, offering actionable insights for researchers and practitioners.
연구 동기 및 목표
- 최근 몇 년간 DL이 다루는 재무 사기 유형의 경향을 평가한다.
- DL로 가능해진 전처리, 불균형 데이터 처리, 자동화 개선을 평가한다.
- 사기 탐지를 위한 DL 모델의 발전을 식별한다.
- 다양한 부문에서의 벤치마크와 평가 지표의 경향과 불균형 데이터와의 연관성을 검토한다.
- 데이터 프라이버시, 익명화, 규제가 DL 적용에 미치는 영향을 탐구한다.
제안 방법
- Kitchenham 시스템적 검토 프레임워크를 적용하여 연구를 선택하고 합성한다.
- 도메인 키워드를 사용하여 PubMed, SSRN, IEEE Xplore, ACM DL, ScienceDirect, Scopus를 검색한다.
- 2019–2024년의 원본, 영어로 된 동료심사를 거친 DL 기반 사기 탐지 연구를 선별한다.
- 데이터세트, 모델, 전처리, 지표, 프라이버시 고려사항에 대한 구조화된 데이터를 추출한다.
- Python 라이브러리와 VOSviewer를 사용하여 키워드 네트워크의 경향을 시각화한다.

실험 결과
연구 질문
- RQ1최근 몇 년간 DL을 사용하여 다루는 재무 사기 유형의 경향은 무엇인가?
- RQ2특징 공학, 불균형 데이터에 대한 데이터 전처리, DL을 통한 자동화가 성능과 탐지 시간에 어떤 영향을 미쳤는가?
- RQ3재무 사기 탐지를 위한 DL 모델에서 어떤 발전이 있었나?
- RQ4부문 간 벤치마크 및 평가 지표의 경향은 무엇인가?
- RQ5데이터 프라이버시, 익명화, 규제 규칙이 재무 사기 탐지를 위한 DL 적용에 어떤 영향을 미쳤나?
주요 결과
| Metrics Name | Formula | Description |
|---|---|---|
| Accuracy | (TP+TN)/(TP+TN+FP+FN) | Measures the proportion of correctly classified instances (fraud and non-fraud) out of the total instances. High accuracy is not always reliable in fraud detection due to class imbalance. |
| Precision | TP/(TP+FP) | Measures the proportion of correctly predicted fraud cases out of all predicted fraud cases. High precision indicates fewer false positives. |
| Recall (Sensitivity) | TP/(TP+FN) | Measures the proportion of actual fraud cases correctly identified by the model. High recall indicates fewer false negatives. |
| F1 Score | 2×(Precision×Recall)/(Precision+Recall) | The harmonic mean of precision and recall. Balances precision and recall when both false positives and false negatives are costly. |
| AUC-ROC | Area under the ROC curve (TPR vs FPR) | Measures the model’s ability to distinguish fraud from non-fraud across thresholds. |
| AUC-PR | Area under the Precision-Recall curve (Precision vs Recall) | Focuses on the positive class in imbalanced datasets; higher is better. |
| False Positive Rate (FPR) | FP/(FP+TN) | Proportion of legitimate transactions incorrectly flagged as fraud. |
| False Negative Rate (FNR) | FN/(FN+TP) | Proportion of fraudulent transactions missed by the model. |
| Cost of False Positives | C_FP × FP | Financial/operational cost of incorrectly flagging legitimate transactions. |
| Cost of False Negatives | C_FN × FN | Financial loss or risk from failing to detect fraud. |
- 초기 결과 2,858편에서 분석 대상이 57편으로 좁혀졌으며, 2019–2024에 걸친 연구를 다룬 57편의 고품질 논문이 분석되었다.
- DL 사기 탐지 연구는 2019–2021년 사이에 꾸준히 증가했고, 2022년 이후 큰 폭으로 증가했으며 2023–2024년에 급격히 증가했다.
- 신용카드 및 은행 부문이 가장 큰 연구 활동을 보이고, 암호화폐/블록체인 및 결제가 차차 두드러진 영역으로 부상하고 있으며, 세금/모기지/대출 및 자금세탁은 덜 대표적이다.
- 불균형 데이터는 만연한 문제이며, 57편 중 48편이 불균형을 보고하고 있어 SMOTE, GANs/VAEs, ADASYN, 고급 임퓨테이션의 활용이 촉진되었다.
- 자동화 및 프라이버시 보호 기법(블록체인, 연합학습, PCA)이 탐지를 가속화하고 데이터를 보호하기 위해 점점 더 탐구되고 있다.
- 다양한 모델이 사용되며 LSTM, MLP, CNN, Transformer 기반 방법, GNN, GAN, VAE가 진전을 이끌고 있으며 하이브리드 모델과 도메인 특화 지표가 일반적이다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.