[논문 리뷰] FingerNet: Pushing The Limits of Fingerprint Recognition Using Convolutional Neural Network
본 논문은 PolyU 데이터에서 데이터 증강을 사용하여 사전 학습된 ResNet50를 미세조정하는 엔드-투-엔드 CNN 지문 인식 프레임워크를 제시하며 PolyU에서 최첨단 정확도를 달성한다. 또한 중요한 지문 영역을 시각화한다.
Fingerprint recognition has been utilized for cellphone authentication, airport security and beyond. Many different features and algorithms have been proposed to improve fingerprint recognition. In this paper, we propose an end-to-end deep learning framework for fingerprint recognition using convolutional neural networks (CNNs) which can jointly learn the feature representation and perform recognition. We train our model on a large-scale fingerprint recognition dataset, and improve over previous approaches in terms of accuracy. Our proposed model is able to achieve a very high recognition accuracy on a well-known fingerprint dataset. We believe this framework can be widely used for biometrics recognition tasks, making more scalable and accurate systems possible. We have also used a visualization technique to highlight the important areas in an input fingerprint image, that mostly impact the recognition results.
연구 동기 및 목표
- 핸드크래프트(hand-crafted) 특징의 한계를 극복하기 위해 딥러닝을 활용한 지문 인식 향상을 목표로 한다.
- 지문 이미지로부터 직접 표현을 학습하는 엔드-투-엔드 CNN 프레임워크를 제안한다.
- 클래스당 샘플이 제한된 지문 데이터셋에서 사전 학습된 네트워크를 미세조정하여 전이 학습을 탐색한다.
- 이전 방법과의 성능을 평가하고 지문 이미지에서 영향력 있는 영역의 시각화를 제공한다.
제안 방법
- 증강된 학습 데이터를 사용하여 PolyU 지문 데이터셋에서 사전 학습된 ResNet50 (ImageNet)을 미세조정한다.
- 마지막 층을 클래스 수에 맞게 교체하고 교차 엔트로피 손실로 학습한다.
- 데이터 증강(flips, random crops, distortions)을 사용하여 실제 샘플 크기를 약 3배로 증가시킨다.
- 마지막 완전 연결층 가중치에 L2 정규화를 적용: L_final = L_class + lambda1 ||W_fc||_F^2.
- Adam 옵티마이저(lr = 0.0001)를 사용하여 Nvidia Tesla GPU에서 배치 크기 24로 100 에포크 학습한다.
- 모든 이미지를 224x224로 다운샘플링하고 PyTorch로 구현한다.
실험 결과
연구 질문
- RQ1ImageNet에서 학습된 CNN의 전이 학습이 피사건당 샘플이 적은 데이터셋에서 지문 인식을 향상시킬 수 있는가?
- RQ2적은 샷 지문 설정에서 데이터 증강이 인식 정확도에 어떤 영향을 미치는가?
- RQ3제안된 CNN 기반 접근법이 PolyU 지문 데이터셋에서 기존의 특징 기반 방법과 어떻게 비교되는가?
- RQ4시각화된 주목 영역에 따라 지문의 어떤 영역이 인식에 가장 정보가 많은가?
주요 결과
- PolyU 지문 데이터셋에서 95.7%의 정확도를 달성하여 같은 데이터셋의 기존 방법보다 우수하다.
- Table I에 보고된 바와 같이 PolyU에서 Scattering Network(92%) 및 Gabor-wavelet(95.5%) 기초 모델을 능가한다.
- 데이터 증강으로 실제 학습 샘플 수가 대략 3배 증가했다.
- 마지막 층을 조정한 사전 학습된 ResNet50을 미세조정하면 강력한 인식 성능을 얻는다.
- 시각적 주목 맵은 인식 결과를 좌우하는 중요한 지문 영역을 식별한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.