· Уменьшение времени на ввод данных с бумажных форм в 10 раз.
· Повышение точности итоговых данных благодаря поддержке технологий OCR, ICR, OMR и технологии распознавания штрихкодов.
· Быстрая окупаемость системы благодаря разумной стоимости и низким затратам на внедрение.
Семейство ABBYYFormReader 6.5 включает в себя:
· простую во внедрении и изучении систему ABBYYFormReader 6.5 DesktopEdition для использования на локальной рабочей станции.
· распределённое и легко масштабируемое решение ABBYYFormReader 6.5 EnterpriseEdition для потокового ввода больших объёмов данных;
· средство разработки ABBYYFormReader 6.5 DeveloperEdition для интеграции функций FormReader во внешние приложения;
· инструментарий ABBYYFlexiCaptureStudio 1.5 для создания на базе ABBYYFormReader с технологией ABBYYFlexiCapture решений для обработки гибких форм и документов.
ABBYYFormReader успешно используют банки, страховые компании, маркетинговые агентства и производственные компании, государственные учреждения и учебные заведения, торговые компании и медицинские организации.
ABBYYFormReader способен обрабатывать любые типы форм, соответствующие простым требованиям машиночитаемости, автоматически сортирует бланки, проверяет комплектацию многостраничных форм, не требует вмешательства оператора на этапах сканирования и распознавания.
Система предполагает автоматический контроль результатов распознавания с помощью перекрёстных проверок, правил контроля сумм, сверок по словарям и базам данных. Существует возможность создать собственные правила проверки, в том числе с подключением списков и словарей, и использовать их для контроля качества вводимых данных.
Использование локальной версии ABBYYFormReader позволяет силами одного сотрудника вводить ежедневно от 500 до 1000 страниц в зависимости от сложности формы и аппаратной конфигурации. Если объём работ по вводу данных увеличится, пользователь в течение дня сможет модифицировать существующий комплекс, перейдя на версию с большей производительностью. Чтобы увеличить скорость обработки форм на 1000 страниц в день, достаточно установить FormReader на еще одно рабочее место [3,4,12].
FineReaderBank — система автоматизированного ввода платежных поручений — также является продуктом разработки компании ABBYY. FineReaderBank — готовое приложение, в основе которого лежит технология распознавания гибких форм [5,6].
3.2 Система Cognitive Forms
Компания CognitiveTechnologies разработала систему для ввода и обработки форм — Cognitive Forms. Процесс её работы осуществляется следующим образом.
Оператор на станции сканирования помещает пачку документов в устройство автоматической подачи сканера. Нажатием клавиши запускается процесс потокового сканирования документов.
Подсистема распознавания — Cognitive Form-Reader в автоматическом режиме управляет распознаванием и контекстной проверкой правильности распознавания.
На станции визуального контроля (модуль редактирования Cognitive Form Editor) оператор имеет возможность визуально контролировать и редактировать распознанные поля форм перед экспортом в базу данных.
В подсистеме описания форм (Cognitive Form Designer) производится компьютерное описание обрабатываемых форм, используемое на всех этапах процесса ввода от распознавания до экспорта в базу данных.
Подсистема экспорта результатов формирует текстовое представление документа перед его записью в базу данных, с окончательной проверкой на допустимость значений экспортируемых данных. Регистрация записи осуществляется пользователем после ввода и проверки определенного количества документов.
Одним из важных элементов Cognitive Forms является система контроля за правильностью ввода информации. Ее основная функция состоит в том, чтобы точность распознавания на выходе составляла 100%, обеспечивая при этом минимальную степень утомляемости оператора. Человек контролирует лишь те данные, которые не удовлетворяют требованиям правильности распознавания.
Слова документа, содержащие сомнительно распознанные символы или автоматически исправленные подсистемой контекстного контроля, подсвечиваются. Оператору не нужно проверять все содержание текста и сравнивать его с исходным документом. Это гарантирует меньшую утомляемость оператора и соответственно 100%-ю точность ввода информации в самых ответственных операциях. Экспорт в базу данных осуществляется клиентом системы после ввода определенного количества форм.
Благодаря гибкой модульной организации системы имеется возможность простого масштабирования для увеличения производительности ввода.
Система работает по принципу максимальной автоматизации ввода. Все операции, связанные с навигацией по форме, распознаванием, контекстным контролем за корректностью ввода и экспортом в базу данных, происходят без участия оператора.
Участие оператора может потребоваться только на стадии окончательного контроля перед экспортом в базу данных.
По описанию заметно, что в системе обработки форм Cognitive Forms ярко представлены все этапы ввода стандартных форм, а также система является масштабируемой и открытой, что даёт ей преимущества [10,13,14,15].
Выводы к разделу 3
Из нескольких сотен компаний, предлагающих решения или компоненты систем обработки форм, наиболее известными являются системы «ABBYYFineReaderForm» и «Cognitive Forms». Они предлагают различные модули ввода и обработки форм. Организация может приобрести как всю систему, так и отдельные модули. Кроме того, многие компании разрабатывают свои собственные решения, лицензируя у производителей модули обработки. Следовательно, в выборе системы массового ввода следует ориентироваться на особенности организации и формы, преобладающие в ней.
ЗАКЛЮЧЕНИЕ
В деятельности большого количества государственных, акционерных и частных предприятий возникает необходимость обработки структурированных и неструктурированных форм документов, изначально выполненных на бумаге. Обычно под этим понимается первоначальный ввод информации с бумажного документа в информационную систему предприятия и, затем, собственно обработка данных в СУБД и прикладных информационных системах.
Суммарное количество документов, которые должны быть занесены в базу данных для дальнейшей обработки только в одной организации, может достигать нескольких тысяч и даже десятков тысяч в день. Можно представить, в каком масштабе подобные работы производятся в целом по Украине. На это тратятся огромные средства, в то время как проблема может быть решена намного более эффективно.
С ростом числа документов растут и проблемы по вводу и обработке больших объёмов данных в вычислительных системах. Практически в любом бизнесе, связанном с обслуживанием клиентов, а также в деятельности государственных органов, занятых сбором данных о физических и юридических лицах, возникают стандартные формы.
Стандартными формами являются однотипные, имеющие априорную структуру документы, которые классифицируются по таким признакам: способ нанесения информации, геометрическая вариативность полей и наличие явных разделителей полей.
Стандартные формы используются в различных бизнес-приложениях, занимающихся циркуляцией информации между предприятиями и клиентами. Среди основных систем обработки форм можно выделить следующие: обработка факсов, обработка государственных форм, обработка различных счетов и заказов на товары, маркетинговые исследования и опросы, обработка банковских платёжных поручений и др.
Осуществление автоматизированного ввода форм в базу данных подразумевает выполнение нескольких этапов: подготовка обработки формы, сканирование, сегментация полученного изображения, распознавание значимых полей, верификация, сохранение данных в полях базы данных. Причём сам процесс обработки формы включает именно сегментацию изображения формы и извлечение данных из значимых полей.
Придерживание определённых принципов при вводе форм освободит сотни людей от неэффективного утомительного труда. Учёт основных требований, предъявляемых к системам массового ввода форм, а также учёт подходов к их реализации обеспечит реальную экономию, снизит количество опечаток, повысит точность и соответственно достоверность вводимых данных.
Подчас неосведомленность начальства и неэффективная организация работы приводят к тому, что в компьютер вручную вбиваются тысячи однотипных печатных и рукопечатных форм. Объемы подобного труда просто огромны. Если в организации обрабатывается 100 и более форм в день, то нецелесообразность автоматизации их ввода исключается, так как автоматизация экономически себя оправдает.
Наиболее известными системами, предлагающими решения или компоненты систем обработки форм, являются «ABBYYFineReaderForm» и «Cognitive Forms». Они предлагают различные модули ввода и обработки форм. Организация может приобрести как всю систему, так и отдельные модули. Кроме того, многие компании разрабатывают свои собственные решения, лицензируя у производителей модули обработки.
Следовательно, автоматизацию ввода форм могут позволить себе крупные организации с большим объёмом документооборота. Автоматизация сократит затраты на ручной ввод данных из форм и повысит эффективность работы организации вцелом.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. Асєєв, Г.Г. Методологія електронного документообігу: динамічні архіви /Г.Г. Асєєв //Вісн. Кн. Палати. — 2005. — № 11. — С. 22-25
2. Асеев, Г.Г. Электронный документооборот. Учебник /Г.Г. Асеев. — К.: Кондор, 2007. — 500 с.
3. ABBYY: Как правильно организовать автоматизированный ввод документов. [Электронный ресурс]. — Режим доступа: http://www.scandocs.ru/page.jsp?pk=node_1185012951516(5)
4. АBBYYFormReader. [Электронный ресурс]. — Режим доступа: http://www.radius-soft.ru/products/document159.shtml(6)
5. ABBYYFormReader 6.5. [Электронный ресурс]. — Режим доступа: http://www.itprogress.ru/products_ABBYY.html(14)
6. Гулинин, В. Иванова, Г. Документооборотные средства: одиннадцатилетка конференции-выставки DOCFLOW в действии. [Электронный ресурс]. — Режим доступа: http://www.buhcomp.ru/htm/new_namb/arhive_ 2005/07/statyi/statya_3.shtml(9)