Базовым архивным справочником все-таки остается архивная опись. Именно опись, раскрывая содержание документов на уровне дела, несет основную информационную нагрузку. Именно опись, являясь одновременно и учетным документом, закрепляет место каждого дела в определенном фонде, и этот «архивный адрес» сопровождает дело во всех его ипостасях, служит основой для составления других справочников и, в конечном итоге, для выдачи дел. «В настоящее время в 10132 описях ГА РФ сосредоточена информация о более 5,7 млн.дел»[6]. Нет необходимости объяснять, что найти все требуемые дела среди такого количества довольно сложно, тем более, что они могут находиться в разных фондах и описях. Помочь здесь может только перевод описей в электронный формат и создание эффективной поисковой базы данных.
Вновь создаваемые описи при описании документов в стенах архива и при обработке документов в ведомствах имеются как в традиционном виде, так и в электронном формате. Таким образом, новые описи поступают в архив уже в электронном виде, правда, в основном в текстовом редакторе, но обработка такой информации для включения ее в информационно-поисковую систему архива значительно облегчена. «Опыт по созданию электронных описей вызывает интерес в архивной отрасли и в определенной степени использован в Методических рекомендациях ВНИИДАД»[7].
Имеет смысл более подробно остановиться на проблемах, связанных с ретроконверсией традиционных описей: организации работы, методах и методиках, проверке качества, возможности использования.
На первоначальном этапе этой работы все описи были проанализированы на предмет возможности и целесообразности их перевода в электронный формат, определены комплексы фондов, описи которых в первую очередь подлежат ретроконверсии. Решено, что в электронный формат должны переводиться фонды целиком, т.е. все открытые описи каждого выбранного фонда, включая личный состав.
Были изучены различные способы такого перевода: ввод непосредственно в базу данных (ручной набор), конвертирование в базу данных текста описи, набранного в текстовом редакторе, сканирование описей, распознавание текста с помощью специальных программ и последующее конвертирование. Предпочтение, учитывая различные факторы, включающие и особенности самих описей, и временные затраты, а также организационные и технические возможности, отдано двум первым способам как наиболее оптимальным.
Следует отметить, что для создания электронного научно-справочного аппарата архива большое значение имеет разработка единых для архива стандартных форм описания информации на трех уровнях: на уровне фонда, дела, документа. Для каждого уровня информации определен набор реквизитов (полей), основных и дополнительных, их типы и размеры, унифицировано их заполнение, что обеспечивает в дальнейшем их совместимость.
На основе разработанных перечней полей созданы основные таблицы баз данных в MSAccess для всех уровней информации. Именно в таком виде и накапливается весь НСА архива, и этот информационный ресурс может быть использован для поиска информации как в рамках отдельных баз данных, так и в составе единой информационно-поисковой системы, а также для решения других задач, стоящих перед архивом.
Так для ввода информации из описей имеется единая таблица базы данных (дело). В отличие от традиционной описи, в которой информация о деле распределена по 6 графам (номер дела, делопроизводственный номер (индекс) дела, заголовок дела, крайние даты, количество листов, примечание), эта таблица состоит из 25 полей (14 основных, 11 дополнительных). Из 14 основных 7 полей (номер фонда, номер описи, номер дела, название фонда, заголовок дела, крайние даты, дата дела сортировочная) обязательны к заполнению в базе данных, остальные поля заполняются только при наличии соответствующих сведений.
6 полей представляют собой архивный адрес дела: номер фонда, номер описи, литера описи, номер дела и литера дела. При их заполнении имеет значение не только размер поля, его тип (числовое или символьное), но даже использование прописных или строчных букв, латинского шрифта или кириллицы. Строгое соблюдение единых требований при заполнении этих поле обеспечивает в дальнейшем возможность объединения баз данных, в том числе создания многоуровневых баз данных. Заполнение в базе полей «Название фонда» и «Название описи» позволяет полноценно использовать базу данных и локально, не связывая ее с электронными справочниками других уровней описания информации (путеводители, каталоги).
При наличии отдельного текстового поля для крайних дат дела введено специальное поле типа «дата» для систематизации записей по хронологии: «дата дела сортировочная». В связи с тем, что при машинной обработке информации не воспринимается неполная или неточная дата, при заполнении этого поля приняты некоторые условности и даны примеры их заполнения при различных вариантах датировки. Так, например, если имеется начальная и конечная даты дела, то проставляется начальная и наиболее ранняя дата. Если известен только год, то проставляется последнее число последнего месяца этого года (31.12.1919). Если известны только месяц и год, то проставляется последнее число указанного месяца (30.04.1919). В тех случаях, когда в оригинале описи графа «Крайние даты» не заполнена (дата вынесена в название описи, раздел описи) или проставлено Б/Д (без даты), поле «Дата дела сортировочная» заполняется в соответствии с этими датами или крайними датами описи.
Имеются некоторые особенности заполнения поля «Заголовок дела» в базе данных. Так при перечислении однородных заголовков дел не допускается применение формулировки «То же», принятой при оформлении листовой описи. Заголовок дела должен воспроизводиться полностью. При технически пропущенном номере дела в заголовке указывается: «номер пропущен». Отметка о выбывших делах указывается в поле «применение», при этом поле «Заголовок дела», как правило, заполняется.
Кроме того, имеется отдельное поле «Аннотация» куда могут вводится сведения уточняющие, раскрывающие состав и содержание документов дела, не изменяя при этом сам заголовок дела. Это может быть перечень вопросов, содержащихся в документах дела, перечень названий документов, характеристика документов по какой-либо теме и т.п. При усовершенствовании описей в данном поле можно привести так называемый «структурированный заголовок дела», повышающий информативность описи, не внедряясь при этом в сложившийся заголовок дела, что могло бы привести к усложнению описи как основного учетного документа и переоформлению обложек.
В базу данных «опись» введены 4 поля «раздел – уровень 1-4», где указываются названия разделов и подразделов описи в соответствии с ее внутренней структурой и систематизацией дел. Предусмотрена возможность четырех уровней систематизации. Каждый уровень (раздел) указывается в отдельном поле.
В базе данных имеются 4 дополнительных поля, в которые могут вводиться ключевые слова – дескрипторы для уточнения поиска информации и формирования алфавитных указателей по предметному признаку: география; персоналии; учреждения; ключевые слова (тематика).
Поля «оператор» и «дата заполнения» служат для учета работы.
Информация о делах, содержащихся в описях, переводится в электронный вид в полном соответствии с текстом оригинала, исправляются только явные опечатки. В отдельных случаях сотрудники архива проводят частичное редактирование заголовков, с обращением непосредственно к делам. Все вопросы, касающиеся учета дел (порядковый номер дела, итоговая запись), решаются в обязательном порядке с отделом сохранности и учета документов.
Работа по переводу описей в электронный формат, особенно в массовом порядке, должна включать обязательную проверку качества ввода информации. Может быть, более правильным было бы осуществление полной сверки (считки) базы данных с текстом оригинала, но это привело бы к значительным трудозатратам и снижению положительного эффекта от данной работы. Кроме того, в предложенных моделях ИПС всегда можно посмотреть электронный образ описи.
Проверка качества ввода информации проводится с максимально возможным применением средств MicrosoftAccess (путем составления различных запросов).
Проверяется полнота базы данных. С помощью запросов автоматически составляются перечни введенных фондов и описей, которые сверяются со списками описей, передаваемых для обработки. Проводится проверка соответствия названий фондов и описей их номерам. Весь проверяемый массив тестируется на наличие пустых записей, дублетных записей, не заполненных обязательных полей (номер фонда, номер описи, номер дела, название фонда, заголовок дела, крайние даты, дата дела сортировочная).
Таким образом, значение по созданию электронных описей очевидно, затраченные финансовые и трудовые ресурсы в дальнейшем окупятся. В результате этой работы архив получает не только электронные описи, но и выверенный электронный реестр описей по фондам архива, который является важной частью любой поисковой системы.
Наличие электронных описей открывает новые возможности их использования. Один раз введенная информация на уровне дела может многократно использоваться с самыми разными целями в различных информационно-поисковых системах и баз данных, во взаимодействии с другими электронными справочниками.
И все же самым важным преимуществом электронных описей, основной целью их создания является возможность сквозного поиска информации по заголовкам дел, всех описей, представленных в базе данных.
2.2 Электронный архив Газпромбанка
Около года назад компания CognitiveTechnologies объявила о завершении внедрения электронного архива финансовых и организационно-распорядительных документов в филиалах КБ «Газпромбанк» по России.
Поставленная руководством «Газпромбанка» перед компанией CognitiveTechnologies задача выглядела следующим образом: создание автоматизированной системы, предназначенной для обработки и архивирования банковских документов операционного дня и закрытых договоров, организации безбумажного архива документов, повышения надежности хранения документов и создания эффективной технологии оперативной работы с архивом документов.