[논문 리뷰] Handwritten Bangla Basic and Compound character recognition using MLP and SVM classifier
이 논문은 다층 퍼셉트론(MLP) 및 서포트 벡터 머신(SVM) 분류기를 사용하여 수기로 쓴 방글라 기본 문자와 복합 문자를 인식하기 위한 하이브리드 기계학습 접근법을 제안한다. 빈도가 높은 복합 문자를 단계적으로 우선순위에 따라 처리함으로써, 이 방법은 삼중 교차검증을 통해 평균 인식률 79.25%를 달성하며, 방글라 문자의 높은 복잡성과 시각적 유사성 문제를 해결한다.
A novel approach for recognition of handwritten compound Bangla characters, along with the Basic characters of Bangla alphabet, is presented here. Compared to English like Roman script, one of the major stumbling blocks in Optical Character Recognition (OCR) of handwritten Bangla script is the large number of complex shaped character classes of Bangla alphabet. In addition to 50 basic character classes, there are nearly 160 complex shaped compound character classes in Bangla alphabet. Dealing with such a large varieties of handwritten characters with a suitably designed feature set is a challenging problem. Uncertainty and imprecision are inherent in handwritten script. Moreover, such a large varieties of complex shaped characters, some of which have close resemblance, makes the problem of OCR of handwritten Bangla characters more difficult. Considering the complexity of the problem, the present approach makes an attempt to identify compound character classes from most frequently to less frequently occurred ones, i.e., in order of importance. This is to develop a frame work for incrementally increasing the number of learned classes of compound characters from more frequently occurred ones to less frequently occurred ones along with Basic characters. On experimentation, the technique is observed produce an average recognition rate of 79.25 after three fold cross validation of data with future scope of improvement and extension.
연구 동기 및 목표
- 50개의 기본 문자와 약 160개의 복합 문자 클래스를 포함한, 복잡하고 시각적으로 유사한 수기로 쓴 방글라 문자를 인식하는 데 도전하는 것.
- 단계적 학습 프레임워크에서 빈도가 높은 복합 문자를 우선순위에 두어 인식 복잡성을 줄이는 것.
- 기본 문자에서 시작하여 빈도가 높은 복합 문자로 확장되는 증분 학습 프레임워크를 개발하는 것.
- 높은 변동성과 형태학적 다양성으로 인해 복잡한 수기로 쓴 방글라 문자의 OCR 성능을 향상시키는 것.
제안 방법
- 구분 가능한 패턴을 포착하기 위해 수기로 쓴 방글라 문자 이미지에 특징 추출 파이프라인을 적용한다.
- 데이터셋을 빈도에 따라 복합 문자를 우선순위에 두도록 분할하여 증분 학습을 가능하게 한다.
- 추출된 특징에 대해 다층 퍼셉트론(MLP) 및 서포트 벡터 머신(SVM) 분류기를 훈련하고 평가한다.
- 모든 문자 클래스에 걸쳐 일반화 성능을 평가하기 위해 삼중 교차검증을 사용한다.
- 빈도 순서로 복합 문자 클래스를 단계적으로 추가하며, 가장 흔한 것부터 시작한다.
- 모든 클래스에 걸쳐 전체 평균 인식률을 계산하기 위해 인식 결과를 집계한다.
실험 결과
연구 질문
- RQ1하이브리드 MLP 및 SVM 접근법이 수기로 쓴 방글라 문자의 기본 및 복합 문자를 효과적으로 인식할 수 있는가?
- RQ2문자 빈도 기반 증분 학습이 인식 정확도에 어떤 영향을 미치는가?
- RQ3방글라 문자 집합처럼 크고 복잡한 문자 집합에서 달성 가능한 인식률은 얼마인가?
- RQ4특징 표현 방식과 분류기 선택은 시각적으로 유사한 복합 문자에 대해 성능에 어떤 영향을 미치는가?
- RQ5우선순위가 부여된 학습 전략은 높은 다양성을 가진 수기로 쓴 글자 쓰기 인식의 복잡성을 줄이는 데 효과적인가?
주요 결과
- 삼중 교차검증을 통해 제안된 방법은 모든 기본 및 복합 방글라 문자에 대해 평균 인식률 79.25%를 달성한다.
- 빈도가 높은 복합 문자의 인식을 우선순위에 두는 것은 학습 효율성과 모델 안정성을 향상시킨다.
- MLP와 SVM 분류기의 조합은 수기로 쓴 방글라 문자의 높은 변동성에 대응하는 데 뛰어난 강건성을 보였다.
- 증분 학습 프레임워크는 복합 문자 클래스의 수가 많아도 효과적으로 확장될 수 있었다.
- 향상된 특징 공학 및 더 큰 훈련 데이터를 통해 향후 성능 향상 잠재력이 뚜렷하게 드러났다.
- 연구 결과는 빈도 기반 클래스 우선순위 전략이 수기로 쓴 문자 인식 시스템의 복잡성 관리에 실현 가능하다는 점을 확인했다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.