Skip to main content
QUICK REVIEW

[논문 리뷰] Handwritten Bangla Alphabet Recognition using an MLP Based Classifier

Subhadip Basu, Nibaran Das|arXiv (Cornell University)|2012. 03. 05.
Handwritten Text Recognition Techniques참고 문헌 4인용 수 54
한 줄 요약

이 논문은 24개의 색감 특징, 16개의 중심점 특징, 36개의 가장 긴 연속 특징를 포함하는 76개 요소로 구성된 특징 집합을 사용하여 수필적 방글라 알파벳 인식을 위한 다층 퍼셉트론(MLP) 기반 분류기를 제안한다. 시스템은 훈련 데이터에서 86.46%의 정확도와 테스트 데이터에서 75.05%의 정확도를 기록하여 전체 방글라 OCR 시스템에 통합될 수 있는 가능성을 보여준다.

ABSTRACT

The work presented here involves the design of a Multi Layer Perceptron (MLP) based classifier for recognition of handwritten Bangla alphabet using a 76 element feature set Bangla is the second most popular script and language in the Indian subcontinent and the fifth most popular language in the world. The feature set developed for representing handwritten characters of Bangla alphabet includes 24 shadow features, 16 centroid features and 36 longest-run features. Recognition performances of the MLP designed to work with this feature set are experimentally observed as 86.46% and 75.05% on the samples of the training and the test sets respectively. The work has useful application in the development of a complete OCR system for handwritten Bangla text.

연구 동기 및 목표

  • 인도 차분 지역과 전 세계적으로 널리 사용되는 수필적 방글라 알파벳을 인식하기 위한 강력한 분류기를 개발하기 위해.
  • 수필적 방글라 문자의 구조적 및 공간적 특성을 효과적으로 포착하는 특징 집합을 설계하기 위해.
  • 실제 수필적 방글라 데이터셋을 기반으로 한 MLP 분류기의 성능을 평가하여 OCR 응용 분야에 기여하기 위해.
  • 방글라 문자를 위한 완전하고 기능적인 OCR 시스템 개발에 기여하기 위해.

제안 방법

  • 시스템은 각 수필적 방글라 문자를 표현하기 위해 24개의 색감 특징, 16개의 중심점 특징, 36개의 가장 긴 연속 특징를 포함하는 76개 요소의 특징 벡터를 사용한다.
  • 다층 퍼셉트론(MLP) 분류기는 역전파 알고리즘을 사용하여 특징 벡터를 해당 방글라 알파벳 클래스로 매핑하도록 훈련된다.
  • 특징 추출은 수필적 선의 공간 분포와 구조적 패턴을 분석함으로써 이루어진다.
  • 훈련 및 테스트는 실제 수필적 샘플에서 수집한 데이터셋을 기반으로 수행되며, 분류 정확도를 통해 성능을 측정한다.
  • MLP 아키텍처는 특징 공간 내 비선형 결정 경계를 모델링하기 위해 다수의 은닉층을 포함한다.
  • 일반화 성능를 평가하기 위해 시스템은 훈련 세트와 테스트 세트 모두에서 평가된다.

실험 결과

연구 질문

  • RQ1맞춤형 76개 요소 특징 집합을 사용할 때, MLP 분류기가 수필적 방글라 알파벳을 인식하는 데 얼마나 효과적인가?
  • RQ2기하학적 및 구조적 특징의 어떤 조합이 수필적 방글라 문자의 분류에 가장 잘 대응하는가?
  • RQ3MLP 분류기가 알려지지 않은 테스트 샘플에 대해 일반화 성능는 어떠한가?
  • RQ4제안된 특징 집합과 분류기는 전체 방글라 OCR 파ip라인에 통합될 수 있는가?

주요 결과

  • MLP 분류기는 훈련 세트에서 86.46%의 인식 정확도를 기록하여 볼 수 있는 데이터에 대한 강력한 학습 능력을 보였다.
  • 독립된 테스트 세트에서는 75.05%의 인식 정확도를 기록하여 알려지지 않은 수필적 샘플로의 일반화 능력을 입증하였다.
  • 색감, 중심점, 가장 긴 연속 특징를 조합한 76개 요소 특징 집합은 방글라 문자의 구별 특징을 효과적으로 포착하는 데 성공하였다.
  • 결과는 실용적인 OCR 환경에서 MLP 기반 접근법을 사용한 방글라 수필 문자 인식의 가능성을 입증하였다.
  • 훈련 정확도와 테스트 정확도 사이의 격차는 일반화 성능 향상을 위한 잠재적 개선 여지를 시사하며, 데이터 증강 또는 모델 최적화를 통해 가능성이 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.