Модифицированый метод распознавания текста на стандартизированном изображении

Abstract

UK: Розроблено модифікований метод розпізнавання стандартизованого тексту на зображенні. Виділені етапи обробки зображення перед використанням методу: перетворення зображення в чорно-біле, виправлення спотворень символів, детектування окремих символів. Розпізнавання символів здійснено нейронною мережею за допомогою методу шаблонів. Представлені два варіанти рішення поставленої задачі – перший типовий, другий модифікований. В результаті проведених експериментів підтверджується ефективність модифікованого методу. EN: OCR images of very topical problem of modern search engines. There are many different methods and techniques for OCR. This article presents a method for recognizing text in a standardized image. Standardized image has a single font, same size characters, a certain order of their writing, such as the serial number. In this paper we developed an improved method for recognizing text from the image. This improvement is in the preliminary finding of the same characters. First, the image area highlighted with symbols. Individual characters are compared with each other. Identical symbols are recognized only once. After recognizing characters collocate in their places. Image processing and used as borders by JavaCV. This method was compared to the standard method of OCR template method. Both methods were implemented in Java. To create a program was constructed neural network. This neural network consists of a single layer perceptron. According to the results of the tests showed the superiority of this method over the original. In the best case, the modified method is faster than 300%. In the worst case it is only slowly at 5 to 10%. Also, the modified algorithm requires less time to three iterations. RU: Разработан модифицированный метод распознавания текста на изображении. Выделены этапы обработки изображения перед применением метода: преобразование изображения, исправление искажений, детектирование символов. Распознавание символов осуществлено нейронной сетью с помощью метода шаблонов. Представлены два варианта решения поставленной задачи – первый реализован по известному алгоритму, второй модифицированный. В результате проведенных экспериментов подтверждается эффективность модифицированного метода.

Description

Касьян К. Н. Разработка модифицированного метода распознавания текста на стандартизированном изображении / К. Н. Касьян, В. В. Братчиков, В. В. Шкарупило // Восточно-Европейский журнал передовых технологий. – 2015. – 3/2 (75). – С. 11 – 17. DOI: 10.15587/1729-4061.2015.43047.

Keywords

розпізнавання тексту, метод шаблонів, еталон, нейронна мережа, перцептрон, OCR, OpenCV, template method, ethalon, neural network, perceptron, распознавание текста, метод шаблонов, эталон, нейронная сеть

Citation