Пояснения о функциональных возможностях
программы распознавания «АМАДО Цифра»©
Программное обеспечение (далее – ПО, приложение) под названием
«АМАДО Цифра»© разработано в интернет – агентстве «АМАДО» в г.
Перми. Агентство создано и специализируется на разработке интернет
продуктов (сайтов, рекламы, и др). в том числе связанных с оцифровкой и
распознаванием текстовой и графической чертежной документации.
Приложение представляет собой исполняемый консольный скрипт,
т.е. приложение запускается в отдельном окне консоли и не имеет
привычных элементов управления.
Приложение является комплексом программных инструментов
(включая ПО «ToDataDocs»), последовательно выполняющих функции
распознавания документов. Приложение оперирует PDF файлами. В одном
PDF файле могут быть несколько разных по типу и количеству страниц
документов. После запуска, приложение отслеживает все PDF файлы,
которые перенесли в указанную папку и запускает их обработку.
Процесс
обработки документов делится на следующие этапы:
1. Чтение изображений из PDF
2. Улучшение изображений для увеличения качества сканирования
3. Распознавание текста из изображений
4. Определение границ и типов документов (классификация). На этом
этапе определяется где заканчивается например, определение и
начинается судебный приказ или новое определение
5. Получает данные из документов по определенным правилам. Набор
правил определяется для каждого из типов документов. При
обработке документа, набор правил выбирается исходя из его типа.
Правила устанавливаются до запуска приложения в конфигах
документов
6. Сохранение полученных данных в папку в указанном формате,
например, в таблицах excel или в табличных файлах .csv
Скорость распознавания электронных текстов или сканов после
настройки ПО может достигать 100 000 страниц в минуту и выше.
Типы документов, количество листов, форма представления
распознанных данных устанавливаются по требованию заказчиков.
Программа может интегрироваться как самостоятельный модуль, например
в платформу РИСОГД (региональная информационная система
градостроительной деятельности) или другие системы по выбору
заказчика.
Визуализация интерфейса показана на Рис 1 и Рис 2.
Рис. 1. Файлы в папке приложения.
Рис 2. Пример работающего приложения.
Существует Демо-версия ПО, которая иллюстрирует весь процесс распознавания. Агентство «АМАДО» с готовностью предоставит Демо-версию для ознакомления и демонстрации.