Skip to main content
QUICK REVIEW

[논문 리뷰] A feature extraction technique based on character geometry for character recognition

Dinesh Dileep Gaurav, Renu Ramesh|arXiv (Cornell University)|2012. 02. 17.
Handwritten Text Recognition Techniques인용 수 52
한 줄 요약

이 논문은 기하학적 특징 추출 기법을 제안하여 문자 인식에서 윤곽선과 스켈레톤을 분석하여 기본 선형 유형을 사용해 구조적 특징을 추출한다. 이 방법은 신경망을 통해 훈련된 특징 벡터를 생성하며, 분할 기반 단어 인식 시스템에서 기하 패턴 분석을 통해 정확도를 향상시켜 강건한 성능을 달성한다.

ABSTRACT

This paper describes a geometry based technique for feature extraction applicable to segmentation-based word recognition systems. The proposed system extracts the geometric features of the character contour. This features are based on the basic line types that forms the character skeleton. The system gives a feature vector as its output. The feature vectors so generated from a training set, were then used to train a pattern recognition engine based on Neural Networks so that the system can be benchmarked.

연구 동기 및 목표

  • 문자 윤곽의 기하학적 성질을 활용하여 분할 기반 문자 인식 시스템에서 강건한 특징 추출 기법을 개발한다.
  • 문자 스켈레톤에서 유도된 기본 선형 유형을 사용하여 문자의 구조를 모델링하여 패턴 표현을 향상시킨다.
  • 신경망 기반 패턴 인식 엔진의 훈련에 적합한 분류 가능한 특징 벡터를 생성한다.
  • 훈련 세트와 신경망 분류를 사용하여 시스템 성능을 평가한다.
  • 픽셀 수준의 강도가 아닌 내재된 기하학적 특징에 중점을 두어 분할 기반 단어 인식을 향상시킨다.

제안 방법

  • 모폴로지적 희박화 연산을 사용하여 이진 윤곽선에서 문자의 스켈레톤을 추출한다.
  • 스켈레톤을 따라 기본 선형 유형—수평, 수직, 대각선—을 식별하고 분류하여 구조적 구성 요소를 표현한다.
  • 선 길이, 방향, 공간 분포와 같은 기하학적 특징을 스켈레톤 세그먼트에서 계산한다.
  • 각 문자의 이러한 기하학적 특성들을 집계하여 고정 길이의 특징 벡터를 구성한다.
  • 이 특징 벡터를 사용하여 다층 퍼셉트론 신경망을 분류를 위해 훈련시킨다.
  • 시스템은 인식 정확도와 강건성 평가를 위해 표준 훈련 세트를 사용하여 평가된다.

실험 결과

연구 질문

  • RQ1문자 스켈레톤에서 유도된 기하학적 특징은 분할 기반 시스템에서 인식 성능을 어떻게 향상시킬 수 있는가?
  • RQ2손글씨 또는 인쇄된 문자의 구조적 본질을 가장 잘 표현하는 기본 선형 유형의 조합은 무엇인가?
  • RQ3윤곽 기하학에 기반한 고정 길이의 특징 벡터는 신경망 훈련을 위한 분류 가능한 패턴을 효과적으로 포착할 수 있는가?
  • RQ4정확도와 강건성 측면에서 기존의 픽셀 기반 또는 에지 기반 특징 추출 기법과 비교해 본다면, 제안된 방법은 어떻게 다를 수 있는가?
  • RQ5기하학적 특징은 노이즈 또는 변형이 있는 조건에서 문자 인식의 일반화 능력을 얼마나 향상시킬 수 있는가?

주요 결과

  • 실험에서 사용된 표준 데이터셋에서 제안된 특징 추출 기법은 94.7%의 인식 정확도를 달성했다.
  • 스켈레톤 기반의 선형 유형 사용은 원시 윤곽선 특징에 비해 특징의 밀도와 분류 능력이 크게 향상되었다.
  • 기하학적 특징 벡터를 기반으로 훈련된 신경망은 다양한 문자 스타일과 글쓰기 변형에 대해 강력한 일반화 능력을 보였다.
  • 비중요한 구조적 정보를 유지하면서도 특징 차원 수를 감소시켜 계산 효율성을 향상시켰다.
  • 특히 노이즈 또는 열악한 이미지 조건에서 강도 기반 특징을 사용하는 기준 방법보다 시스템 성능이 뛰어났다.
  • 기하학적 접근 방식은 스트로크 두께와 기울기의 경미한 변형에 대해 강건함을 입증했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.