Смекни!
smekni.com

по информационным технологиям в истории на тему: 6 использование информационных технологий в исследовании проблемы дворянских собраний на территории беларуси в последней четверти XVIII начала XX вв. 6 (стр. 3 из 5)

Одной из тематических БД, имеющей практическое значение для изучаемой проблематики, является БД «Родовод» [3]. Работа над проектом «АИПС – Родовод», создаваемой для ведения учета документов генеалогического характера, началась ещё в 1994 г. Коллектив разработчиков БелНИИДАД остановил свой выбор на системе «Конструктор» – разработке МП «Сканер». Система сочетает в себе черты реляционных, иерархических и сетевых СУБД.

БД «Родовод» представляет собой именной и географический указатель к фонду 333 «Минская казенная палата». База содержит следующие сведения: фонд, опись, дело, губерния, уезд, дата документа, лист, название имения, фамилия владельца, название селения и сословие проживающих в нем лиц, номер двора по текущей и предыдущей ревизиям, фамилия. Количество записей в БД – 89 300. Сама база данных организована следующим образом.

Первый корень содержит перечень всех современных населенных пунктов Беларуси, упорядоченных по административно-территориальному признаку. Три следующих корня отражают документы, содержащие генеалогическую информацию: метрические книги, ревизские сказки и инвентари. Структура корня: фонд, опись, дело.

Второй корень «Метрические книги». Для каждого объекта «дело» создается следующий уровень «приход». На уровне приходов предусмотрены характеристики: название прихода историческое; вероисповедание (католическое, православное и т.п.), характер информации в источнике (записи о рождении, браке, смерти), цифровой код для связывания со сканированным изображением данного документа; 3 таблицы с данными соответственно о рождениях, браках, смертях, относящимися к данному приходу. Структура всех таблиц однотипна: номер листа; номер записи; дата записи события; дата совершения события; название населенного пункта, в котором состоялось событие; фамилия главного участника события (новорожденного, жениха, умершего) и фамилии других лиц, упомянутых вместе с ним (крестных, невесты, свидетелей и др.); примечания.

Третий корень «Ревизские сказки». Для каждого объекта «дело» создаются 2 последующих уровня: уровень имений и уровень селений. Объекты «имение» обладают следующими характеристиками: историческое название имения; ссылка на современный населенный пункт в первом корне, отождествляемый с центром имения; фамилия, имя владельца имения в источнике. Каждому объекту «имение» соответствует несколько объектов «селение», отражающих данные о населенных пунктах в составе данного имения, со следующим набором характеристик: историческое название селения; ссылка на современный населенный пункт в первом корне; цифровой код для связывания со сканированным изображением документа; таблица с данными по каждой записи. Структура таблицы: номер листа; номер двора по предыдущей ревизии; номер двора по текущей ревизии; фамилии лиц, проживающих в данном дворе; примечания (отметки о прибытии из другого селения, убытии, смерти и др.).

Четвертый корень «Инвентари помещичьих имений». Структура полностью соответствует структуре предыдущего корня, за исключением таблицы, в которой отсутствует поле «номер двора по предыдущей ревизии», т.к. в инвентарях такая информация отсутствует.

Ещё одной БД, представляющей практический интерес по теме дворянских собраний, является БД «Белорусская шляхта» [3]. Она представляет собой указатель к фондам 319 «Минское дворянское депутатское собрание» и 2512 «Витебское губернское дворянское собрание» Национального исторического архива г. Минска. Здесь имеется информация о протоколах заседаний Дворянских Депутатских собраний, родословных книг, персональных дел. Собственно БД содержит следующие сведения: фамилия (на русском, белорусском и польском языках), название герба, дата вывода, дата сопричисления, дата и номер указа сената, фонд, опись, дело, лист. Количество записей в БД – 6 500.

Генерацией баз данных занимаются и библиотеки нашей республики. В НББ созданы базы данных, имеющие практическое значение в изучении темы дворянских собраний. Здесь имеются в виду БД «История Беларуси», а так же БД «Беларусь у асобах і падзеях» [4, с.95 – 96].

БД «История Беларуси» начала создаваться в 1993 г. Она включает основные и аналитические библиографические описания документов, независимо от языка издания, по истории Беларуси. Данная база является основой для печатных библиографических указателей «Літаратура па гісторыі і гістарычных навуках Беларусі» и «Беларусь у Вялікай Айчынай вайны». Поисковые возможности: автор, персоналии, заглавие документа, словарь географических названий, частично – ключевые слова.

БД «Беларусь у асобах і падзеях», начало создания которой относится к 1997 г., является объектографической базой, хранящей сведения о персоналиях, имеющих отношение к Беларуси по месту жительства и внесших свій вклад в историю, науку, культуру страны, а также событиях, предприятиях, учреждениях, вошедших в историю Беларуси. В область описания персоналий входят: фамилия, имя, отчество, годы жизни, сословие, род, идентифицирующий признак (звания, титулы), территориальный признак, отрасль, род занятий. В область описания событий входят: наименование события, фамилии авторов (кто писал о событии), участников, руководителей; отрасль, территория, родовое понятие. Все области являются поисковыми. На основе данной базы печатается календарь «Даты беларускага календара».

Таким образом, использование БД значительно облегчает поиск нужных архивных документов, поэтому на этапе поиска источников по теме дворянских корпораций целесообразно обращаться к базам данных белорусских архивов и библиотек, используя ИТ как одно из средств облегчения поисковой деятельности.

3.2 Перспективы использование ИТ в контент-анализе исторических источников по теме дворянских собраний на территории Беларуси в последней четверти XVIII – начале XX вв.

Контент-анализ – это, прежде всего, количественный метод, предполагающий числовую оценку каких-то компонентов текста, могущую дополняться также различными качественными классификациями и выявлением тех или иных структурных закономерностей. С точки зрения лингвистов и специалистов по информатике, контент-анализ является типичным примером прикладного информационного анализа текста, сводящегося к извлечению из всего разнообразия имеющейся в нем информации каких-то специально интересующих исследователя компонентов и представлению их в удобной для восприятия и последующего анализа форме.

Использование контент-анализа возможно при изучении дворянских корпораций. Дворянские депутатские собрания оставили после себя многочисленные протоколы – документы, относящиеся к массовым источникам. Массовыми являются источники, характеризующие такие объекты действительности, которые образуют определенные общественные системы с соответствующими структурами. Массовые источники отражают сущность и взаимодействие массовых объектов, составляющих эти системы, а, следовательно, строение, свойства и состояние самих этих систем [15, с.6 – 7].

В ходе контент-аналитического исследования, как для анализа текстов дворянских депутатских собраний западных губерний Российской империи в последней трети XVIII – начале XX вв., так и для последующей обработки его результатов может использоваться вычислительная техника. На этапе квантификации, т.е. перевода данных в числовую форму, целесообразно применение, например, программы «Wordstat» или «VAAL». Так, при помощи программы «Wordstat» можно подсчитать количество употреблений слова в тексте. Программа «VAAL» позволяет оценить неосознаваемое эмоциональное воздействие фонетической структуры текстов и отдельных слов на подсознание человека, производить словарный анализ текстов, осуществлять полноценный контент-анализ текста по большому числу специально составленных встроенных категорий, а также категорий, задаваемых самим пользователем.

После квантификации данных, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными средствами, в том числе специализированными статистическими пакетами, позволяющими применять самые современные методы математической статистики для обработки данных. Одним из самых распространенных статистических пакетов для проведения контент-анализа является пакет SPSS (Statistical Package for the Social Science) [11]. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований: с помощью разработанной в Институте русского языка РАН программы Dialex, способной осуществлять составление частотных словарей и конкордансов, а также поиск лексических единиц с их контекстами и сохранять его результаты в базе данных; в настоящее время завершается работа над более совершенной системой, предназначенной для решения тех же задач. Имеется ряд зарубежных контент-аналитических компьютерных систем, а также систем, потенциально применимых для целей контент-анализа – такова, в частности, система KEDS, разработанная Ф. Шродтом в Канзасском университете и используемая для анализа потока политических событий, отображаемых на ленте информационного агентства «Рейтер».