QUICK REVIEW

[논문 리뷰] Recognition of Non-Compound Handwritten Devnagari Characters using a Combination of MLP and Minimum Edit Distance

Sandhya Arora, Debotosh Bhattacharjee|arXiv (Cornell University)|2010. 06. 30.

Handwritten Text Recognition Techniques참고 문헌 15인용 수 44

한 줄 요약

이 논문은 다층 퍼셉트론(MLP) 분류기와 최소 편집 거리(MED)를 영상 및 체인 코드 히스토그램 특징과 조합하여 오프라인 수기 비복합 데브나가리 문자를 이중 단계 인식 체계로 처리하는 방법을 제안한다. 가중치가 부여된 다수결 투표를 통한 초기 분류와 허리스 코너 검출을 활용한 MED를 통해 형태가 유사한 문자를 해결함으로써 7,154개의 샘플 데이터셋에서 90.74%의 인식 정확도를 달성한다.

ABSTRACT

This paper deals with a new method for recognition of offline Handwritten non-compound Devnagari Characters in two stages. It uses two well known and established pattern recognition techniques: one using neural networks and the other one using minimum edit distance. Each of these techniques is applied on different sets of characters for recognition. In the first stage, two sets of features are computed and two classifiers are applied to get higher recognition accuracy. Two MLP's are used separately to recognize the characters. For one of the MLP's the characters are represented with their shadow features and for the other chain code histogram feature is used. The decision of both MLP's is combined using weighted majority scheme. Top three results produced by combined MLP's in the first stage are used to calculate the relative difference values. In the second stage, based on these relative differences character set is divided into two. First set consists of the characters with distinct shapes and second set consists of confused characters, which appear very similar in shapes. Characters of distinct shapes of first set are classified using MLP. Confused characters in second set are classified using minimum edit distance method. Method of minimum edit distance makes use of corner detected in a character image using modified Harris corner detection technique. Experiment on this method is carried out on a database of 7154 samples. The overall recognition is found to be 90.74%.

연구 동기 및 목표

형태 변화와 시각적 유사성으로 인해 높은 정확도로 수기 비복합 데브나가리 문자를 인식하는 데 도전하는 것.
시각적으로 유사한 문자의 잘못된 분류를 줄이기 위해 이를 별도의 처리 경로로 분리하는 것.
특징 다양성과 가중치가 부여된 다수결 기반의 분류기 융합을 통해 인식 성능을 향상시키는 것.
기하학적 및 구조적 특징을 활용해 혼동이 쉬운 문자 쌍을 구분하는 강력한 방법을 개발하는 것.
신경망과 문자열 편집 기반 분류 전략을 융합하여 총합 인식 정확도를 높이는 것.

제안 방법

입력 문자 이미지에서 영상 특징과 체인 코드 히스토그램 특징을 추출하여 이중 MLP 분류를 수행한다.
영상 특징을 사용하는 하나의 MLP와 체인 코드 히스토그램 특징을 사용하는 다른 하나의 MLP를 별도로 훈련한다.
두 MLP의 결정을 가중치가 부여된 다수결 투표 방식으로 융합하여 상위 3개 후보 문자를 도출한다.
상위 3개 후보 간의 상대적 차이 값을 계산하여 문자를 두 그룹으로 분류: 형태가 뚜렷한 문자와 혼동되는 문자.
혼동되는 문자 집합에 대해 수정된 허리스 코너 검출 알고리즘을 통해 검출된 코너 점을 기반으로 최소 편집 거리(MED)를 적용한다.
코너 점의 순서를 기반으로 한 MED를 사용하여 구조적 유사도를 측정하고, 가장 유사한 기준 문자에 최종 레이블을 할당한다.

실험 결과

연구 질문

RQ1MLP와 최소 편집 거리의 융합된 하이브리드 접근 방식이 수기 데브나가리 문자의 인식 정확도 향상에 기여하는가?
RQ2가중치가 부여된 다수결 투표와 함께 영상 및 체인 코드 히스토그램 특징을 사용할 경우 초깃분류 성능은 얼마나 향상되는가?
RQ3코너 기반 표현을 활용한 최소 편집 거리 기법이 시각적으로 유사한 데브나가리 문자 간의 혼동을 어느 정도 해소할 수 있는가?
RQ4형태가 뚜렷한 문자와 혼동되는 문자로 분류하는 것이 전체 인식 성능 향상에 기여하는가?
RQ5특징 다양성과 분류기 융합이 비복합 데브나가리 문자의 인식 정확도에 미치는 영향은 어떠한가?

주요 결과

제안된 이중 단계 방법은 7,154개의 수기 데브나가리 문자 샘플로 구성된 데이터셋에서 총합 90.74%의 인식 정확도를 달성하였다.
영상 특징과 체인 코드 히스토그램 특징을 사용하는 이중 MLP는 특징 수준의 다양성으로 인해 初기 분류의 신뢰도를 향상시켰다.
가중치가 부여된 다수결 투표 방식은 두 개의 별도된 특징 세트에서 유도된 결정을 융합함으로써 잘못된 분류를 효과적으로 줄였다.
코너 검출을 통한 최소 편집 거리 기반 접근 방식은 시각적으로 유사한 혼동되는 문자 쌍의 인식을 크게 향상시켰다.
문자를 형태가 뚜렷한 집합과 혼동되는 집합으로 분류함으로써 맞춤형 분류 전략을 적용할 수 있었고, 이는 전체 시스템의 강건성을 향상시켰다.
수정된 허리스 코너 검출 기법은 혼란스러운 문자의 MED 기반 분류에 필수적인 구조적 특징을 성공적으로 추출하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.