QUICK REVIEW

[논문 리뷰] An Anti-fraud System for Car Insurance Claim Based on Visual Evidence

Pei Li, Bingyu Shen|arXiv (Cornell University)|2018. 04. 30.

Advanced Neural Network Applications참고 문헌 11인용 수 28

한 줄 요약

이 논문은 모바일 기기에서 촬영한 시각적 증거를 활용하여 실시간으로 사기성 자동차 보험 청구를 탐지하는 시스템을 제안한다. 손상 지역을 정확하게 식별하기 위해 미세조정된 YOLO 검출기와 VGG-16 기반의 전역, 국소 및 히스토그램 특징 융합 기반의 강력한 매칭 기법을 결합하였다. 시스템은 실제 환경 조건에서 46.73%의 랭크-1 정확도를 달성하였다.

ABSTRACT

Automatically scene understanding using machine learning algorithms has been widely applied to different industries to reduce the cost of manual labor. Nowadays, insurance companies launch express vehicle insurance claim and settlement by allowing customers uploading pictures taken by mobile devices. This kind of insurance claim is treated as small claim and can be processed either manually or automatically in a quick fashion. However, due to the increasing amount of claims every day, system or people are likely to be fooled by repeated claims for identical case leading to big lost to insurance companies.Thus, an anti-fraud checking before processing the claim is necessary. We create the first data set of car damage images collected from internet and local parking lots. In addition, we proposed an approach to generate robust deep features by locating the damages accurately and efficiently in the images. The state-of-the-art real-time object detector YOLO \cite{redmon2016you}is modified to train and discover damage region as an important part of the pipeline. Both local and global deep features are extracted using VGG model\cite{Simonyan14c}, which are fused later for more robust system performance. Experiments show our approach is effective in preventing fraud claims as well as meet the requirement to speed up the insurance claim prepossessing.

연구 동기 및 목표

모바일 기기에서 확보한 시각적 증거를 활용하여 증가하는 반복 보험 청구 문제를 해결한다.
결제 이전에 사기성 청구를 실시간으로 탐지할 수 있는 확장 가능한 시스템을 개발한다.
손상 영역에 대한 수동 레이블링이 포함된 공개 가능한 첫 번째 자동차 손상 이미지 데이터셋을 구축한다.
딥 네트워크에서 추출한 국소, 전역 및 히스토그램 특징의 융합을 통해 특징의 강건성을 향상시킨다.
다양한 조명 조건과 시점에서의 실제 환경 조건에서도 차량 간 사기 탐지 기능을 구현한다.

제안 방법

인터넷에서 확보한 1790장의 이미지와 현장 주차장에서 촬영한 92장의 이미지를 포함한 새로운 자동차 손상 데이터셋을 수집하였으며, 각 이미지에 대해 수동으로 레이블링된 손상 바운딩 박스가 포함되어 있다.
실시간 손상 탐지를 위한 YOLO를 미세조정하였으며, 데이터 증강, 드롭아웃 및 국소 응답 정규화를 활용해 일반화 능력을 향상시켰다.
전체 차량 이미지에서 전역 특징과 검출된 손상 영역에서 국소 특징을 VGG-16 네트워크를 통해 추출하였다.
국소, 전역 및 색상 히스토그램 특징(8~32개의 버킷)을 융합하여 더 높은 구분 능력을 가진 최종 기술 특징을 생성하였다.
프로브 청구와 이전 청구 기록의 기존 데이터베이스 간 유사성 매칭에 코사인 거리를 사용하였다.
성능 평가를 두 가지 프로토콜(주체가 겹치는 경우와 주체가 분리된 경우)을 기반으로 수행하였다.

실험 결과

연구 질문

RQ1모바일 기기로 촬영한 이미지만을 사용하여 실시간으로 종단 간(end-to-end) 시스템이 반복 보험 청구를 탐지할 수 있는가?
RQ2국소, 전역 및 히스토그램 특징의 융합이 사기 탐지 정확도에 어떤 영향을 미치는가?
RQ3손상 탐지 정확도가 전체 사기 탐지 성능에 미치는 영향은 어느 정도인가?
RQ4조명, 시점 및 이미지 품질의 변동이 시스템의 강건성에 어떤 영향을 미치는가?
RQ5사기 탐지에서 특징 표현을 향상시키기 위해 최적의 히스토그램 버킷 크기는 무엇인가?

주요 결과

32개 버킷의 색상 히스토그램 특징을 사용할 경우 시스템은 46.73%의 랭크-1 정확도를 달성하였으며, 이는 32개 버킷에서 최고 성능을 기록하였다.
검출된 손상 영역에서 유도한 국소 특징을 통합함으로써 랭크-1 정확도가 56.52%로 향상되었으며, 전역 특징만을 사용할 경우 19.6%에 그쳤다.
YOLO 기반의 손상 탐지가 아닌 진짜 손상 영역의 레이블링을 사용한 경우 성능 저하가 미미하여, 탐지기의 강건성을 시사한다.
주체가 겹치는 탐지 프로토콜이 주체가 분리된 프로토콜보다 높은 정밀도와 재현율을 보이며 성능이 뛰어나, 모델이 더 많은 관련 데이터에 노출된 덕분으로 보인다.
32개 버킷을 초과하여 히스토그램 버킷 수를 늘릴 경우 성능이 약간 떨어져, 수익 감소와 과적합으로 인한 잡음의 가능성으로 보인다.
YOLO 기반 탐지기는 IoU 임계값 0.5에서 89.72%의 리콜과 14.62%의 정밀도를 기록하여 강력한 실시간 탐지 능력을 입증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.