[논문 리뷰] Recognition of Handwritten Bangla Basic Characters and Digits using Convex Hull based Feature Set
이 논문은 고립된 손글씨 바ング라 문자와 숫자의 인식을 향상시키기 위해 125개의 속성을 포함한 새로운 볼록껍데기 기반 특징 집합을 제안한다. 다층 퍼셉트론(MLP) 분류기를 사용하여, 바ング라 문자의 인식률은 76.86%로, 숫자의 인식률은 대규모 데이터셋에서 99.45%를 기록하며, 볼록껍데기에서 파생된 위상적 특징이 바ング라 OCR에 효과적임을 입증한다.
In dealing with the problem of recognition of handwritten character patterns of varying shapes and sizes, selection of a proper feature set is important to achieve high recognition performance. The current research aims to evaluate the performance of the convex hull based feature set, i.e. 125 features in all computed over different bays attributes of the convex hull of a pattern, for effective recognition of isolated handwritten Bangla basic characters and digits. On experimentation with a database of 10000 samples, the maximum recognition rate of 76.86% is observed for handwritten Bangla characters. For Bangla numerals the maximum success rate of 99.45%. is achieved on a database of 12000 sample. The current work validates the usefulness of a new kind of feature set for recognition of handwritten Bangla basic characters and numerals.
연구 동기 및 목표
- 고립된 손글씨 바낭라 문자 및 숫자 인식을 위한 강력한 특징 집합을 개발하기 위해.
- 최근 제안된 볼록껍데기 기반 특징 집합이 형태 변화를 얼마나 잘 포착하는지 평가하기 위해.
- 확장 가능하고 계산적으로 효율적인 방법을 사용하여 바낭라 숫자 및 기본 문자의 높은 인식 정확도를 달성하기 위해.
- 손글씨 스타일의 변동성을 볼록껍데기에서 유도된 위상적 특징을 통해 해결하기 위해.
- 국소 하위이미지 분석과 전반적 볼록껍데기 특성의 조합이 향상된 패턴 표현을 가능하게 하는지 검증하기 위해.
제안 방법
- 각 손글씨 문자 이미지의 볼록껍데기는 O(n log n) 복잡도를 가진 그레고리안 스캔 알고리즘을 사용하여 계산된다.
- 볼록껍데기 내부의 계곡과 lacustrine 영역을 기반으로 125개의 위상적 특징을 추출한다.
- 각 문자 이미지는 볼록껍데기의 중심을 기준으로 네 개의 하위이미지로 분할되어 국소 형태 세부 정보를 캡처한다.
- 각 하위이미지에 대해 새로운 볼록껍데기를 계산하여 국소화된 위상적 특징을 추출한다.
- 학습률 0.8과 동력 0.7을 가진 역전파 알고리즘을 사용하여 한 개의 은닉층을 가진 다층 퍼셉트론(MLP)을 훈련시킨다.
- 시스템은 바낭라 문자 10,000건과 숫자 12,000건의 샘플을 대상으로 평가되며, 무작위로 훈련-테스트 분할이 이루어진다.
실험 결과
연구 질문
- RQ1볼록껍데기 기반 위상적 특징은 손글씨 바낭라 문자 및 숫자의 형태 변화를 효과적으로 표현할 수 있는가?
- RQ2기존 특징 집합과 비교할 때 제안된 특징 집합의 인식 정확도는 어떠한가?
- RQ3바낭라 손글씨 데이터에서 인식 성능을 최대화하기 위해 MLP의 최적의 은닉 뉴런 수는 얼마인가?
- RQ4하위이미지 분할 및 국소화된 볼록껍데기 분석은 전반적 볼록껍데기 특징에 비해 인식 성능을 얼마나 향상시키는가?
- RQ5거부 메커니즘이 없이도 제안된 방법이 높은 정확도를 달성할 수 있는가?
주요 결과
- 제안된 볼록껍데기 기반 특징 집합은 MLP의 은닉 뉴런 수 60개를 사용할 때 바낭라 기본 문자의 최대 인식률 76.86%를 달성하였다.
- 바낭라 숫자의 경우, MLP의 은닉 뉴런 수 40개를 사용할 때 최고 인식률 99.45%를 기록하였다.
- 문자 인식률은 은닉 뉴런 수가 60개를 초과하면 정점에 도달하고 약간 감소하여 이 시점 이후 과적합이 발생함을 시사하였다.
- 숫자 인식률은 다양한 은닉 뉴런 수에 걸쳐 항상 99% 이상 유지되어 매우 높은 강건성을 보였다.
- 동일한 문자 데이터베이스에서 이전의 접근 방식보다 성능이 뛰어나며, 이전에 유사한 작업이 없는 점을 감안할 때 숫자 인식 분야에서 새로운 기준을 설정하였다.
- 하위이미지 분석과 볼록껍데기 위상의 통합은 특히 복잡한 문자 형태에서 특징 표현을 크게 향상시켰다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.