QUICK REVIEW

[논문 리뷰] VISER: Visually-Informed System for Enhanced Robustness in Open-Set Iris Presentation Attack Detection

Byron Dowling, Eleanor Frederick|arXiv (Cornell University)|2026. 03. 18.

Biometric Identification and Security인용 수 0

한 줄 요약

VISER가 어떤 인간 주의성 유형(손 주석, eye-tracking, segmentation) 및 foundation-model 임베딩이 열린 집합 아이리스 PAD를 개선하는지 조사하여, denoised initial eye-tracking saliency가 cross-entropy baseline보다 가장 큰 이득을 제공합니다.

ABSTRACT

Human perceptual priors have shown promise in saliency-guided deep learning training, particularly in the domain of iris presentation attack detection (PAD). Common saliency approaches include hand annotations obtained via mouse clicks and eye gaze heatmaps derived from eye tracking data. However, the most effective form of human saliency for open-set iris PAD remains underexplored. In this paper, we conduct a series of experiments comparing hand annotations, eye tracking heatmaps, segmentation masks, and DINOv2 embeddings to a state-of-the-art deep learning-based baseline on the task of open-set iris PAD. Results for open-set PAD in a leave-one-attack-type out paradigm indicate that denoised eye tracking heatmaps show the best generalization improvement over cross entropy in terms of Area Under the ROC curve (AUROC) and Attack Presentation Classification Error Rate (APCER) at Bona Fide Presentation Classification Error Rate (BPCER) of 1%. Along with this paper, we offer trained models, code, and saliency maps for reproducibility and to facilitate follow-up research efforts.

연구 동기 및 목표

어떤 형태의 인간 주의성(손 주석, eye-tracking, segmentation)이 열린 집합 아이리스 PAD에서 가장 좋은 일반화 성능을 제공하는지 평가합니다.
인간 주의성 guided 모델을 열린 집합 아이리스 PAD에서 기본 모델 임베딩과 비교합니다.
eye-tracking heatmaps의 denoising 접근법을 도입하여 주의성-guided 학습을 향상시킵니다.
재현성을 지원하기 위한 데이터, 코드 및 주의 맵을 제공합니다.

제안 방법

DenseNet-121 기반 D-NetPAD를 오픈-세트 아이리스 PAD 백본으로 사용합니다.
모델을 target saliency와 일치시키는 CAM을 포함하는 주의 손실과 함께 교차 엔트로피 손실로 학습합니다( Boyd 등).
세분화 마스크, 다양한 엔트로피의 손 주석, 시선 추적 히트맵(전체 및 초기 단계), HDBSCAN를 사용한 노이즈 제거 변형 등 여러 주의성 양상을 평가합니다.
DINOv2-Base 기반의 foundation-model 임베딩을 로지스틱 회귀, SVM(선형), SVM(RBF) 분류기와 함께 테스트합니다.
AUROC 및 BPCER = 1%에서 APCER로 성능을 평가하고 XENT baseline 대비 개선을 보고합니다.

Figure 2 : Example of applying HDBSCAN to de-noise the eye tracking data. Clusters made up of valid fixations are distinguished by color and larger marks denote longer fixations, not fixation area. Black crosses indicate fixations marked as noise excluded from the final saliency map.

실험 결과

연구 질문

RQ1시선 추적 주의성이 초기 손 주석이나 분할보다 미지의 공격 유형에 대해 열린 집합 아이리스 PAD에서 더 잘 일반화되는가?
RQ2주의성 가이드 학습 방법이 열린 집합 아이리스 PAD에서 foundation-model 임베딩을 사용하는 현대 PAD 솔루션보다 우수한가?
RQ3시선 추적 응시도 맵의 노이즈 제거가 주의성 가이드 학습의 성능을 향상시키는가?

주요 결과

시선 추적 주의성, 특히 De-noised Initial Eye Tracking은 XENT baseline 대비 가장 큰 AUROC 향상(+약 0.061) 및 BPCER 1%에서 APCER 향상(+약 0.1063)을 제공합니다.
초기 시선 추적 맵에서 노이즈 제거를 적용한 경우 다른 주의성 유형 및baseline을 능가하며, 분할 마스크와 손 주석은 일반적으로 APCER@BPCER1%에서 베이스라인을 능가하지 못합니다.
Foundation 모델을 이용한 DINOv2의 결과는 혼합적이며, AUROC를 소폭 개선하는 경우는 DINOv2+SVM-RBF뿐이고 다른 변형은 일관되게 베이스라인을 이기지 못합니다.
노이즈 제거의 이점은 초기 시선 추적에서 뚜렷하지만(AUROC +0.0608, APCER Δ +0.1063), 전체 시선 추적에서는 덜 일관적입니다(AUROC +0.0429, APCER Δ +0.0857).
전반적으로 시선 추적 기반 주의성 가이드 학습은 본 실험 설정에서 foundation-model 기반 접근보다 열린 집합 아이리스 PAD에서 더 우수하게 나타납니다.

(a) Segmentation Mask of the Iris Region

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.