QUICK REVIEW

[論文レビュー] Detection of Anomalies in Large Scale Accounting Data using Deep Autoencoder Networks

Marco Schreyer, Timur Sattarov|arXiv (Cornell University)|Sep 15, 2017

Anomaly Detection Techniques and Applications参考文献 32被引用数 79

ひとこと要約

本論文は、 reconstruction error with attribute-value probabilities を組み合わせて大規模会計データの異常な仕訳を検出する深層オートエンコーダーネットワークを用い、2つの実データ SAP ERP データセットで評価。複数のベースラインを精度で上回り、リコールを高い水準で維持。

ABSTRACT

Learning to detect fraud in large-scale accounting data is one of the long-standing challenges in financial statement audits or fraud investigations. Nowadays, the majority of applied techniques refer to handcrafted rules derived from known fraud scenarios. While fairly successful, these rules exhibit the drawback that they often fail to generalize beyond known fraud scenarios and fraudsters gradually find ways to circumvent them. To overcome this disadvantage and inspired by the recent success of deep learning we propose the application of deep autoencoder neural networks to detect anomalous journal entries. We demonstrate that the trained network's reconstruction error obtainable for a journal entry and regularized by the entry's individual attribute probabilities can be interpreted as a highly adaptive anomaly assessment. Experiments on two real-world datasets of journal entries, show the effectiveness of the approach resulting in high f1-scores of 32.93 (dataset A) and 16.95 (dataset B) and less false positive alerts compared to state of the art baseline methods. Initial feedback received by chartered accountants and fraud examiners underpinned the quality of the approach in capturing highly relevant accounting anomalies.

研究の動機と目的

ERP/journal-entryデータにおける赤旗ルールの限界と詐欺適応のため、教師なし異常検知の必要性を動機づける。
深層オートエンコーダーベースのアプローチを提案し、正常なジャーナルエントリのパターンをモデル化して異常を検出する。
再構成誤差と属性値の確率を組み合わせた新規な異常スコアリング機構を開発。
実世界の SAP ERP データセットで評価し、基準手法と比較して有効性と実用性を評価。

提案手法

ジャーナルエントリをバイナリ（ワンホット）符号化属性ベクトルとして表現し、会計特徴を捉える。
ボトルネック構造を持つ深層オートエンコーダーを訓練し、正常なジャーナルエントリの圧縮表現を学習。
各エントリの再構成誤差 E を計算し、偏差の測度として RE を得るように正規化する。
個々の属性値の頻度から属性値確率スコア AP を計算し正規化する。
AS = alpha * RE + (1 - alpha) * AP により異常スコア AS を定義し、閾値 beta を超えた場合に異常と判定する。
深さの効果を調べるために複数のアーキテクチャ（AE1–AE9）を比較し、合成異常の再現性と精度を最適化。

実験結果

リサーチクエスチョン

RQ1深層オートエンコーダー based reconstruction error, regularized by attribute probabilities, effectively detect anomalous journal entries in large ERP datasets?
RQ2モデルの深さは、実世界の会計データにおける異常検知性能と偽陽性率にどう影響するか？
RQ3提案されたオートエンコーダーベースのアプローチは、このドメインの標準的な教師なし異常検知手法と比較してどうか？
RQ4この手法を用いて検出された異常を監査人がレビューする際、グローバルとローカルの観点でどんな定性的洞察が得られるか？

主な発見

最も深いアーキテクチャ（AE9）は、データセット間の合成異常に対して最も高いリコール（100%）を達成し、検出された異常数は相対的に少なく（データセットAで0.16%、データセットBで0.62%）、高いリコールを維持。
オートエンコーダーベースのアプローチは、ベースラインと比較して高い精度を達成し、偽陽性を大幅に削減（例：OC-SVM 比較でデータセットAで176件、データセットBで97件の削減）。
PCA、LOF、OC-SVM、DBSCAN のベースラインと比較して、オートエンコーダー（AE9）は ROC-AUC で競争力を持ちつつ、異常の精度を大幅に改善。
定性的分析では、検出されたグローバル異常は珍しい属性値や誤掲載が関与することが多く、局所的な異常は otherwise 一般的な属性の組み合わせの異常を捉えることが多いと示され、監査人はフォレンジック審査の観点でこれらのエントリを関連性があると評価した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。