QUICK REVIEW

[논문 리뷰] Off-Line Arabic Handwriting Character Recognition Using Word Segmentation

Manal Abdullah, Lulwah M. Al-Harigy|arXiv (Cornell University)|2012. 06. 07.

Handwritten Text Recognition Techniques참고 문헌 8인용 수 23

한 줄 요약

이 논문은 문자 인식 정확도를 향상시키기 위해 단어 분할을 사용하는 새로운 오프라인 아랍어 손글씨 인식 시스템을 제시한다. 사전 처리된 분할 문자를 유사도 임계값(45–55%)을 사용해 자체 구축한 데이터베이스와 매칭함으로써, 이 방법은 81%의 인식 정확도를 달성하면서도 거짓 수용률(FAR)을 제거한다.

ABSTRACT

The ultimate aim of handwriting recognition is to make computers able to read and/or authenticate human written texts, with a performance comparable to or even better than that of humans. Reading means that the computer is given a piece of handwriting and it provides the electronic transcription of that (e.g. in ASCII format). Two types of handwriting: on-line and offline. The most important purpose of off-line handwriting recognition is in protection systems and authentication. Arabic Handwriting scripts are much more complicated in comparison to Latin scripts. This paper introduces a simple and novel methodology to authenticate Arabic handwriting characters. Reaching our aim, we built our own character database. The research methodology depends on two stages: The first is character extraction where preprocessing the word and then apply segmentation process to obtain the character. The second is the character recognition by matching the characters comprising the word with the letters in the database. Our results ensure character recognition with 81%. We eliminate FAR by using similarity percent between 45-55%. Our research is coded using MATLAB.

연구 동기 및 목표

분할 기반 사전 처리를 사용하여 오프라인 아랍어 손글씨 문자를 인식하는 견고한 방법을 개발하기.
라틴 문자보다 더 복잡한 연결 형태와 문맥적 변형을 특징으로 하는 아랍 문자의 복잡성을 다루기.
인식 과정 중 유사도 기반 임계값 설정 메커니즘을 통해 거짓 수용률(FAR)을 제거하기.
학습 및 평가를 지원하기 위해 자체 구축한 아랍 문자 데이터베이스를 구축하기.
두 단계로 구성된 인식 파이프라인을 구현하고 평가하기: 분할을 통한 문자 추출 및 데이터베이스 매칭을 통한 인식.

제안 방법

분할 이전에 대trast를 향상시키고 노이즈를 제거하기 위해 입력 단어 이미지의 사전 처리를 수행하기.
기하학적 분석 및 투영 프로파일 분석을 사용하여 연결된 아랍 문자 문장에서 개별 문자를 분리하기 위한 단어 분할 적용하기.
비교를 위해 형태학적 및 구조적 분석을 사용하여 분할된 문자에서 특징 추출하기.
유사도 측정 기준을 사용하여 각 분할 문자를 자체 구축한 아랍 문자 데이터베이스와 매칭하기.
모호한 매칭을 거부하고 거짓 수용률(FAR)을 제거하기 위해 45–55%의 유사도 임계값 범위 설정하기.
프로토타ип 및 평가를 위해 전체 시스템을 MATLAB에 구현하기.

실험 결과

연구 질문

RQ1오프라인 환경에서 연결된 손글씨 단어에서 단어 분할이 아랍어 개별 문자를 효과적으로 분리할 수 있는가?
RQ245–55%의 유사도 임계값 범위가 아랍어 문자 인식에서 거짓 수용률(FAR)에 어떤 영향을 미치는가?
RQ3자체 구축한 문자 데이터베이스는 오프라인 아랍어 손글씨 인식 시스템의 인식 정확도를 어느 정도 향상시킬 수 있는가?
RQ4분할 기반 처리와 유사도 기반 매칭을 조합했을 때 달성 가능한 인식 정확도는 얼마인가?
RQ5제안된 방법은 온라인 동적 특징에 의존하지 않고도 신뢰할 수 있는 인증을 달성할 수 있는가?

주요 결과

제안된 방법은 자체 구축한 아랍 문자 데이터베이스에서 81%의 문자 인식 정확도를 달성한다.
매칭 과정에서 45–55%의 유사도 임계값 범위를 적용함으로써 거짓 수용률(FAR)이 완전히 제거된다.
분할 기반 사전 처리가 연결된 아랍어 단어에서 개별 문자를 효과적으로 분리하여 신뢰할 수 있는 특징 추출을 가능하게 한다.
특정 손글씨 스타일에 맞게 맞춤형으로 제작된 데이터베이스 사용은 일반 데이터셋보다 인식 성능 향상에 기여한다.
시스템은 MATLAB로 완전히 구현되어 있어 학술적 및 응용 연구의 타당성과 재현 가능성을 입증한다.
유사도 임계값 메커니즘이 모호하거나 노이즈가 있는 문자 매칭에 대해 강건성을 확보하여 시스템의 보안성과 신뢰성을 향상시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.