Министерство культуры Российской Федерации
Восточно-Сибирская государственная академия культуры и искусств
Факультет менеджмента информационных технологий
Кафедра автоматизированных информационных систем
УДК 002.53:681.3.016
ОРГАНИЗАЦИЯ ДОСТУПА К БАЗАМ ДАННЫХ
ВСГАКиИ В ИНТЕРНЕТ
Дипломная работа
Исполнитель: Фомин Евгений Игоревич
студент заочного отделения группы 453
Научный руководитель: Баторов А.Р.,к.т.н., доцент.
__________________________________________
И.о.зав.кафедрой: Батуева Э.Б., к.п.н., доцент.
__________________________________________
Дата допуска к защите: _____ 06.2001
Улан-Удэ
2001
Оглавление
1. Internet – технология работы с базами данных.. 5
1.1 Реализация доступа к базе данных. 6
1.1.1. Однократное или периодическое преобразование содержимого БД в статические документы.. 7
1.1.2. Динамическое создание гипертекстовых документов на основе содержимого БД.. 7
1.2.1. WWW - сервер NCSA HTTPD.. 9
1.2.2 WWW - сервер Apache c поддержкой Java Servlet. 9
1.2.3. SQL - сервер фирмы Oracle. 11
1.2.4. Язык программирования Perl. 11
1.2.5. Язык программирования Java.. 12
1.2.7. Пакет Web - Oracle - Web. 15
1.2.8. Пакет Cold Fusion фирмы Allaire Corp. 15
1.3. Оценка трудоемкости обеспечения WWW доступа.. 15
2.1.1. Назначение WWW - сервера. Общая схема работы. Определение. 18
2.1.2 Непосредственные функции сервера. Базовые определения. 20
2.2.1 Установка WEB-сервера Apache. 25
2.2.2 Настройка WEB-сервера Apache. 26
2.4. Использование языка Perl. 33
2.5 Использование языка Java.. 34
2.5.1 Основные особенности.. 34
2.5.2. Взаимодействие с СУБД.. 38
2.6. Реализация доступа к базе данных.. 39
2.6.2. Описание алгоритма.. 39
Приложение 1 Спецификация формата RUSMARC.. 51
Приложение 2 Спецификация языка Java.. 90
Приложение 3 Листинг программы – SearchEngein.java.. 103
Приложение 4 Результаты тестирования программы... 111
Многие организации используют электронные базы данных (БД) для поддержки своих рабочих процессов. Часто это системы на одного - двух пользователей, выполненные с использованием dbf - ориентированных средств разработки: Clipper, Dbase, FoxPro, Paradox, Access. Обычно используется ряд таких баз, независимых друг от друга. Если информация, хранимая в таких БД, представляет интерес не только для непосредственных пользователей, то для ее дальнейшего распространения используются бумажные отчеты и справки, созданные базой данных.
С появлением локальных сетей, подключением таких сетей к Интернет, созданием внутрикорпоративных, сетей, появляется возможность с любого рабочего места организации получить доступ к информационному ресурсу сети. Однако, при попытке использовать существующие БД возникают проблемы связанные с требованием к однородности рабочих мест (для запуска "родных" интерфейсов), сильнейшим трафиком в сети (доступ идет напрямую к файлам БД), загрузкой файлового сервера и невозможностью удаленной работы (например, командированных сотрудников). Решением проблемы могло бы стать использование унифицированного интерфейса WWW для доступа к ресурсам организации.
Технология World Wide Web, в переводе "Всемирная паутина", получила столь широкое распространение из-за простоты своих пользовательских интерфейсов. Принцип "жми на то, что интересно", лежащий в основе гипертекста, интуитивно понятен. В технологиях WWW все ключевые понятия просматриваемого документа: слова, картинки - имеют возможность "раскрыться" новым документом, развивающим это понятие. Такой способ представления информации называется "гипертекстом", а документы, представленные в таком виде - "гипертекстовыми документами". Для описания этих документов используется специальный язык - язык описания гипертекстовых документов или HTML (англ. вариант HyperText Markup Language).
Из этих предпосылок возникает задача преобразования накопленных данных в гипертекстовые документы WWW, задача поддержки актуальности преобразованной структуры. Другими словами, задача предоставления WWW - доступа к существующим базам данных.
Цель данной дипломной работы, создать интерфейс к файлам БД Библиотеки 5.0 которые имеют формат RUSMARC (см. прил. 1), так же можно обратиться за информацией по этому формату на сайт РОССИЙСКОЙ БИБЛИОТЕЧНОЙ АССОЦИАЦИИ (12,11) .
Для реализации поставленной задачи был выбран язык программирования JavaTM
Дипломная работа состоит из 2-х глав и 4 приложений.
В первой главе Internet – технология работы с базами данных, рассматриваются имеющиеся на данный момент времени технологии по организации доступа к базам данных пользователей Интренет.
Во второй главе Практическая часть поэтапно описывается технология организации доступа к базе данных в формате RUSMARC в частности:
· настройка WEB-сервера Apache;
· настройка Java Server для WEB-сервера Apache;
· выбор инструментария для реализации программы:
· описание алгоритма.
Первое приложение содержит полное описание спецификации формата RUSMARC с детальным описанием всех полей и подполей и возможных их значении.
Во втором приложении приведены ключевые моменты спецификации языка программирования Java.
Третье приложение содержит листинг программы с включенными в него комментариями.
В четвертом приложении приведены результаты проведенного теста на реальных массивах данных.
1. Internet – технология работы с базами данных
1.1 Реализация доступа к базе данных.
Использование технологий WWW для обеспечения доступа к каким-либо информационным ресурсам подразумевает существование следующих компонент.
1. IP - сети с поддержкой базового набора услуг по передаче данных с единой политикой нумерации и маршрутизации, работающим сервисом имен DNS.
2. Выделенного информационного сервера - WWW-сервера, обеспечивающего предоставление гипертекстовых документов через IP - сеть в ответ на запросы WWW – клиентов (см. рис. 1).
Передаваемые гипертекстовые документы оформляются в стандарте HTML - языке описания гипертекстовых документов. Эти документы могут либо храниться в статическом виде (совокупность файлов на диске), либо динамически компоноваться в зависимости от параметров запроса специальным программным обеспечением. Для динамической компоновки HTML-документов, WWW-сервер использует специальным образом оформленные программы- CGI- или Java-программы.
В состав специфики конкретной БД входят как технологические основы, такие как тип СУБД, вид интерфейсов, связи между таблицами, ограничения целостности, так и организационные решения, связанные с поддержкой актуальности баз данных и обеспечением доступа к ней (3).
При обеспечении WWW-доступа к существующим БД, возможен ряд путей - комплексов технологических и организационных решений. Практика использования WWW-технологии для доступа к существующим БД предоставляет широкий спектр технологических решений, по-разному связанных между собой - перекрывающих, взаимодействующих и т.д. Выбор конкретных решений при обеспечении доступа зависит от специфики конкретной СУБД и от ряда других факторов, как то: наличие специалистов, способных с минимальными издержками освоить определенную ветвь технологических решений, существование других БД, WWW-доступ к которым должен осуществляться с минимальными дополнительными затратами и т.д.
WWW - доступ к существующим базам данных может осуществляться по одному из трех основных сценариев. Ниже дается их краткое описание и основные характеристики.
В этом варианте содержимое БД просматривает специальная программа, создающая множество файлов - связных HTML-документов (см.рис.2). Полученные файлы могут быть перенесены на один или несколько WWW-серверов. Доступ к ним будет осуществляться как к статическим гипертекстовым документам сервера.