Смекни!
smekni.com

Организация доступа к базам данных в Интернет (стр. 1 из 23)

Министерство культуры Российской Федерации

Восточно-Сибирская государственная академия культуры и искусств

Факультет менеджмента информационных технологий

Кафедра автоматизированных информационных систем

УДК 002.53:681.3.016

ОРГАНИЗАЦИЯ ДОСТУПА К БАЗАМ ДАННЫХ
ВСГАКиИ В ИНТЕРНЕТ

Дипломная работа

Исполнитель: Фомин Евгений Игоревич

студент заочного отделения группы 453

Научный руководитель: Баторов А.Р.,к.т.н., доцент.

__________________________________________

И.о.зав.кафедрой: Батуева Э.Б., к.п.н., доцент.

__________________________________________

Дата допуска к защите: _____ 06.2001

Улан-Удэ

2001

Оглавление

Введение. 3

1. Internet – технология работы с базами данных.. 5

1.1 Реализация доступа к базе данных. 6

1.1.1. Однократное или периодическое преобразование содержимого БД в статические документы.. 7

1.1.2. Динамическое создание гипертекстовых документов на основе содержимого БД.. 7

1.1.3. Создание информационного хранилища на основе высокопроизводительной СУБД с языком запросов SQL. Периодическая загрузка данных в хранилище из основных СУБД.. 8

1.2. Обзор технологий.. 9

1.2.1. WWW - сервер NCSA HTTPD.. 9

1.2.2 WWW - сервер Apache c поддержкой Java Servlet. 9

1.2.3. SQL - сервер фирмы Oracle. 11

1.2.4. Язык программирования Perl. 11

1.2.5. Язык программирования Java.. 12

1.2.6 Java servlets. 12

1.2.7. Пакет Web - Oracle - Web. 15

1.2.8. Пакет Cold Fusion фирмы Allaire Corp. 15

1.3. Оценка трудоемкости обеспечения WWW доступа.. 15

2. Практическая часть.. 17

2.1 ОБЩАЯ ЧАСТЬ.. 18

2.1.1. Назначение WWW - сервера. Общая схема работы. Определение. 18

2.1.2 Непосредственные функции сервера. Базовые определения. 20

2.1.3 Протокол MIME.. 21

2.1.4 Протокол HTTP. 22

2.1.5 Интерфейс CGI. 23

2.2. Web-сервера Apache. 23

2.2.1 Установка WEB-сервера Apache. 25

2.2.2 Настройка WEB-сервера Apache. 26

2.4. Использование языка Perl. 33

2.5 Использование языка Java.. 34

2.5.1 Основные особенности.. 34

2.5.2. Взаимодействие с СУБД.. 38

2.6. Реализация доступа к базе данных.. 39

2.6.1. Общее описание. 39

2.6.2. Описание алгоритма.. 39

Заключение.. 49

Литература.. 50

Приложение 1 Спецификация формата RUSMARC.. 51

Приложение 2 Спецификация языка Java.. 90

Приложение 3 Листинг программы – SearchEngein.java.. 103

Приложение 4 Результаты тестирования программы... 111

Введение.

Многие организации используют электронные базы данных (БД) для поддержки своих рабочих процессов. Часто это системы на одного - двух пользователей, выполненные с использованием dbf - ориентированных средств разработки: Clipper, Dbase, FoxPro, Paradox, Access. Обычно используется ряд таких баз, независимых друг от друга. Если информация, хранимая в таких БД, представляет интерес не только для непосредственных пользователей, то для ее дальнейшего распространения используются бумажные отчеты и справки, созданные базой данных.

С появлением локальных сетей, подключением таких сетей к Интернет, созданием внутрикорпоративных, сетей, появляется возможность с любого рабочего места организации получить доступ к информационному ресурсу сети. Однако, при попытке использовать существующие БД возникают проблемы связанные с требованием к однородности рабочих мест (для запуска "родных" интерфейсов), сильнейшим трафиком в сети (доступ идет напрямую к файлам БД), загрузкой файлового сервера и невозможностью удаленной работы (например, командированных сотрудников). Решением проблемы могло бы стать использование унифицированного интерфейса WWW для доступа к ресурсам организации.

Технология World Wide Web, в переводе "Всемирная паутина", получила столь широкое распространение из-за простоты своих пользовательских интерфейсов. Принцип "жми на то, что интересно", лежащий в основе гипертекста, интуитивно понятен. В технологиях WWW все ключевые понятия просматриваемого документа: слова, картинки - имеют возможность "раскрыться" новым документом, развивающим это понятие. Такой способ представления информации называется "гипертекстом", а документы, представленные в таком виде - "гипертекстовыми документами". Для описания этих документов используется специальный язык - язык описания гипертекстовых документов или HTML (англ. вариант HyperText Markup Language).

Из этих предпосылок возникает задача преобразования накопленных данных в гипертекстовые документы WWW, задача поддержки актуальности преобразованной структуры. Другими словами, задача предоставления WWW - доступа к существующим базам данных.

Цель данной дипломной работы, создать интерфейс к файлам БД Библиотеки 5.0 которые имеют формат RUSMARC (см. прил. 1), так же можно обратиться за информацией по этому формату на сайт РОССИЙСКОЙ БИБЛИОТЕЧНОЙ АССОЦИАЦИИ (12,11) .

Для реализации поставленной задачи был выбран язык программирования JavaTM

Дипломная работа состоит из 2-х глав и 4 приложений.

В первой главе Internet – технология работы с базами данных, рассматриваются имеющиеся на данный момент времени технологии по организации доступа к базам данных пользователей Интренет.

Во второй главе Практическая часть поэтапно описывается технология организации доступа к базе данных в формате RUSMARC в частности:

· настройка WEB-сервера Apache;

· настройка Java Server для WEB-сервера Apache;

· выбор инструментария для реализации программы:

· описание алгоритма.

Первое приложение содержит полное описание спецификации формата RUSMARC с детальным описанием всех полей и подполей и возможных их значении.

Во втором приложении приведены ключевые моменты спецификации языка программирования Java.

Третье приложение содержит листинг программы с включенными в него комментариями.

В четвертом приложении приведены результаты проведенного теста на реальных массивах данных.


1. Internet – технология работы с базами данных

1.1 Реализация доступа к базе данных.

Использование технологий WWW для обеспечения доступа к каким-либо информационным ресурсам подразумевает существование следующих компонент.

1. IP - сети с поддержкой базового набора услуг по передаче данных с единой политикой нумерации и маршрутизации, работающим сервисом имен DNS.

2. Выделенного информационного сервера - WWW-сервера, обеспечивающего предоставление гипертекстовых документов через IP - сеть в ответ на запросы WWW – клиентов (см. рис. 1).

Передаваемые гипертекстовые документы оформляются в стандарте HTML - языке описания гипертекстовых документов. Эти документы могут либо храниться в статическом виде (совокупность файлов на диске), либо динамически компоноваться в зависимости от параметров запроса специальным программным обеспечением. Для динамической компоновки HTML-документов, WWW-сервер использует специальным образом оформленные программы- CGI- или Java-программы.

В состав специфики конкретной БД входят как технологические основы, такие как тип СУБД, вид интерфейсов, связи между таблицами, ограничения целостности, так и организационные решения, связанные с поддержкой актуальности баз данных и обеспечением доступа к ней (3).

При обеспечении WWW-доступа к существующим БД, возможен ряд путей - комплексов технологических и организационных решений. Практика использования WWW-технологии для доступа к существующим БД предоставляет широкий спектр технологических решений, по-разному связанных между собой - перекрывающих, взаимодействующих и т.д. Выбор конкретных решений при обеспечении доступа зависит от специфики конкретной СУБД и от ряда других факторов, как то: наличие специалистов, способных с минимальными издержками освоить определенную ветвь технологических решений, существование других БД, WWW-доступ к которым должен осуществляться с минимальными дополнительными затратами и т.д.

WWW - доступ к существующим базам данных может осуществляться по одному из трех основных сценариев. Ниже дается их краткое описание и основные характеристики.

1.1.1. Однократное или периодическое преобразование содержимого БД в статические документы

В этом варианте содержимое БД просматривает специальная программа, создающая множество файлов - связных HTML-документов (см.рис.2). Полученные файлы могут быть перенесены на один или несколько WWW-серверов. Доступ к ним будет осуществляться как к статическим гипертекстовым документам сервера.