Специалистам Cognitive Technologies была поставлена задача создания архива с возможностью организации ввода больших объемов информации (около 30 млн. документов в год) в системе персонифицированного учета (СПУ) ПФ РФ для создания единой базы данных, содержащей сведения о всех работающих гражданах и осуществляющей учет их доходов. Основными типами вводимых документов в СПУ РФ ПФ являются стандартные бланки с рукописным заполнением, такие, как анкеты застрахованного лица; бланки "Индивидуальные сведения о стаже и заработке"; опись документов, содержащихся в пачках; другие документы СПУ.
В рамках проекта, помимо основного – центрального - архива, были созданы и находятся на стадии внедрения три варианта конфигурации архивов: "Район", "Межрайонный пункт" и "Регион". Архивы различных уровней будут интегрированы между собой.
Ввод документов в архив осуществляется с помощью сканера и системы ввода стандартных форм документов Cognitive Forms, причем система может работать с различными сканерами – от планшетных до потоковых промышленных с автоподатчиком. Количество сканеров, используемых в системе, не ограничено.
Электронный архив фирмы Cognitive Technologies для Пенсионного фонда включает в себя четыре связанные друг с другом основные подсистемы: подсистема ввода, подсистема архивации, подсистема безопасности, подсистема статистики и анализа. Электронный архив имеет возможность гибкого конфигурирования. Определенная независимость подсистем и их внутренняя архитектура позволяют варьировать как используемое оборудование, так и конфигурации подсистем.
В ходе разработки и внедрения архива специалисты фирмы столкнулись со следующей проблемой. Анализ всех организационных и технологических процессов показал, что крайне большие временные и материальные затраты связаны с ручным вводом информации в базу данных. Даже наличие 30-50 операторов не достаточно для ручного ввода информации в периоды пиковых нагрузок. Компанией Cognitive Technologies было предложено комплексное решение автоматизации ввода информации с документов СПУ, заполненных вручную, для ОПФР по г. Москве, основанное на технологии Cognitive Forms, включающее:
разработку машиночитаемых форм различных типов документов СПУ;
организацию потокового сканирования с использованием высокопроизводительного промышленного сканера;
автоматизированную сортировку входящих документов по типам;
автоматическую комплектацию многостраничных документов;
автоматическое распознавание;
средства визуального контроля и коррекции результатов распознавания;
экспорт данных, полученных в процессе распознавания, в Базу Данных ПФР;
автоматическое формирование статистической отчетности о результатах работы системы.
При создании электронного архива Пенсионного фонда было использовано следующее аппаратное обеспечение:
Сканеры Kodak ImageLink 9500 (паспортная производительность: 144 стр. А4/мин. или 8640 стр. А4/час);
Станция сканирования: IBM PC Pentium*166/32MB RAM/1GB;
Станция сортировки и комплектования отсканированных документов: IBM PC Pentium*166/64MB RAM/1GB;
Станция распознавания: IBM PC Pentium*166/64MB RAM/1GB;
Станция редактирования: IBM PC Pentium*166/16MB RAM/1GB;
Файл сервер: IBM PC Pentium*166/64MB RAM/4GB;
Сеть: Ethernet 10Mb/s;
Сервер баз данных: IBM AS/400.
Программное обеспечение включило в себя:
ПО сканера: Kodak HV Capture 2.0;
ПО создания описания форм: Cognitive FormDesigner;
ПО станции распознавания: Cognitive FormReader (рукописное заполнение и отметки);
ПО станции редактирования: Cognitive FormEditor;
Сетевая операционная система: Novell 3.12;
Операционная система на станциях сканирования, распознавания, редактирования: Windows 95;
База данных: IBM DB2/400.
Система архива построена по принципу гибкой масштабируемости. В зависимости от конкретной ситуации, в систему могут быть добавлены (изъяты) технические средства, без изменения технологического процесса обработки информации. При увеличении нагрузок (количества обрабатываемых документов в день) к системе автоматически подключается необходимое количество станций распознавания (редактирования). В обычном режиме, для обработки нескольких тысяч документов в день, используется следующая комплектация технических средств:
1 станция сканирования,
1 станция сортировки и комплектования отсканированных документов,
1 станция распознавания,
20 станций редактирования,
1 файл-сервер.
Систему Cognitive Forms пришлось адаптировать к реальному качеству поступающих документов, т.к. анкеты печатались в разных типографиях и отличались размерами и качеством печати.
Дополнительно было разработано следующее специализированное программное обеспечение:
ПО диспетчеризации для равномерной загрузки всех доступных станций распознавания и редактированияж
ПО статистического анализа результатов ввода;
ПО сортировки входящих документов по типам и комплектации многостраничных документов;
ПО обработки пачек, отбракованных на этапе сортировки (ПО принятия решений, определяющее дальнейших ход пачек: пересканирование (в случае слипания бланков документов) или возврат пачек работодателю с указанием допущенной неточности (ошибки);
ПО автоматического распознавания типа формы документа.
Специалистами фирмы была произведена настройка общего технологического процесса для достижения максимальной производительности операторов и повышения показателей эргономики, были написаны конверторы в уникальные форматы базы данных ОПФР.
Представители ПФ РФ предъявляли особые требования к уровню защищенности информации, хранящейся в архиве, поэтому особое внимание было также уделено разработке мер информационной защиты архива.
Информационная безопасность архива обеспечивается за счет наличия в составе средств, обеспечивающих конфиденциальность работы с информацией. В многопользовательской автоматизированной системе одновременно хранится и обрабатывается информация разных уровней конфиденциальности. Информация в системе хранится в закодированном виде. Каждому пользователю заранее определен объем информации, к которому он допущен. Подсистема управления доступом строится на основе, так называемой трехмерной матрицы разграничения доступа. Для каждого пользователя системы определяются объекты (программы, данные, устройства) к которым он имеет доступ и полномочия (открытие, сохранение, копирование, просмотр и т.д.) доступа. Система обеспечивает:
осуществление идентификации и проверки подлинности субъектов доступа при входе в систему по идентификатору и паролю длиной не менее шести символов;
возможность пользователю самостоятельно изменять свой пароль, если это разрешено администратором безопасности;
возможность администратору безопасности изменить пароль пользователя;
хранение идентификаторов и паролей в Системе в неявном виде;
идентификацию и аутентификацию пользователя с клавиатуры;
управление уровнями конфиденциальности (не менее 5);
контроль доступа и аутентификацию субъектов к защищаемым ресурсам;
для каждого пользователя - право работы с определенных рабочих мест, согласно перечню; идентификация и аутентификация пользователя как с клавиатуры, так и с помощью технических средств, допустимых операционной системой, идентификация и аутентификация программ, томов, файлов, каталогов.
Целостность системы обеспечивается программно - аппаратными средствами. При инсталляции системы целостность программного продукта проверяется автоматически и сообщение о результатах проверок выводится на экран монитора. При загрузке обеспечивается целостность средств защиты информации от несанкционированного доступа, целостность программного обеспечения, целостность записей в базу данных.
Ошибочные действия пользователей и обслуживающего персонала не нарушают работу средств защиты информации. Предусматривается возможность дублирования программно - аппаратного комплекса и оперативного перехода на резервные компоненты. Предусматривается также возможность дублирования средств защиты информации ведением двух копий и возможность периодического обновления этих средств с контролем их работоспособности.
Подсистема криптографической защиты обеспечивает целостность и конфиденциальность как хранимой, так и передаваемой информации. Осуществляется шифрование всей конфиденциальной информации, выводимой на внешние носители. При этом осуществляется автоматическое освобождение областей памяти, содержащих ранее незашифрованную информацию. Доступ субъектов к операциям шифрования и криптографическим ключам контролируется подсистемой управления доступом.
Анализируя результаты разработки и внедрения электронного архива в Пенсионном фонде РФ, можно прийти с следующим заключениям.
Был достигнут бесспорный прогресс в повышении эффективности деятельности предприятия. Система введена в круглосуточную эксплуатацию, что позволило выполнять работы по пополнению архива новыми документами и переводу старых бумажных документов в электронный вид без задержек. Чтобы оценить сравнительное повышение производительности труда, следует сказать, что до реализации проекта один оператор Пенсионного фонда был в состоянии обработать 100-120 бумажных документов (1 страница А4) за 8 часовую смену. После внедрения электронного архива и сопутствующих систем обработки информации один оператор вводит и проверяет правильность ввода 500-600 документов в смену. Планируемый рост производительности ввода – до 800-1,000 документов в смену. Фактически, производительность ввода возросла в 4-5 раз для каждого оператора. За 4 первых месяца эксплуатации было введено 3 млн. анкет, что было бы невозможно старыми средствами.