14. Какова сущность гипертекстовой технологии?
15. Что такое гипертекст?
16. Из чего состоит гипертекст?
17. Для чего служит тезаурус гипертекста?
18. Что такое технология мультимедиа?
19. Что способствовало появлению мультимедиа?
20. Какова сфера применения технологии мультимедиа?
Тема 5. Распределенные технологий обработки и хранения данных
Лекция 7.Технология обработки данных
При использовании информационных технологий компьютерных сетей становится возможной реализация территориального распределения производства. Появляются проблемы, связанные с межконтинентальным снабжением, поясным временем и т.д. , реализация которых становится возможной благодаря новейшим сетевым технологиям и развитию коммуникаций.
Одной из важнейших сетевых технологий является распределенная обработка данных. Персональные компьютеры (ПК) устанавливаются на рабочих местах, т.е. на местах возникновения и использования информации, и соединяются каналами связи. Это дает возможность распределить ресурсы ПК по отдельным функциональным сферам деятельности и изменить технологию обработки данных в направлении децентрализации. Распределенная обработка данных предоставляет пользователю ряд преимуществ:
- большое число взаимодействующих между собой пользователей, выполняющих функции сбора, регистрации, хранения, передачи и выдачи информации;
- снятие пиковых нагрузок с централизованной базы путем распределения обработки и хранения локальных баз данных на разных ЭВМ;
- обеспечение доступа информационного работника к вычислительным ресурсам сети ЭВМ;
- обеспечение симметричного обмена данными между удаленными пользователями.
Введение классификации моделей представления данных на иерархические, сетевые и реляционные отразилось на архитектуре систем управления базами данных и технологии их обработки. Архитектура системы управления базой данных (СУБД) описывает ее функционирование как взаимодействие процессов двух типов: клиента и сервера.
Существуют два понятия распределенная обработка и распределенная база данных, которые не являются синонимами. Если при распределенной обработке производится работа с базой данных, то представление данных, их содержательная обработка, работа с базой на логическом уровне выполняются на ПК клиента, а поддержание БД в актуальном состоянии – на сервере. В случае использования распределенной базы данных БД размещается на нескольких серверах. Работа с базой данных осуществляется на этих же или других ПК, и для доступа к удаленным данным необходимо использовать сетевую СУБД.
В системе распределенной обработки клиент может послать запрос к собственной локальной базе данных или к удаленной БД. Удаленный запрос – это единичный запрос к одному серверу. Несколько удаленных запросов к одному серверу объединяются в удаленную транзакцию. Если отдельные запросы транзакции обрабатываются различными серверами, то транзакция называется распределенной. При этом один запрос обрабатывается одним сервером. Распределенная СУБД позволяет обрабатывать один запрос несколькими серверами. Такой запрос называется распределенным. Только обработка распределенного запроса поддерживает концепцию распределенной базы данных.
Базы данных – это автоматизированные хранилища оперативно обновляемой информации. В настоящее время созданы БД по всем направлениям человеческой деятельности: финансовой, экономической, научно-технической, электронной документации, кредитной, статистической, маркетинга, газетных сообщений, правительственных распоряжений, патентной информации, библиографической и т.д. При этом все БД делятся на коммерческие и общественные.
Организация обработки данных зависит от способа их распределения. Существуют централизованный, децентрализованный и смешанный способы распределения данных.
Централизованная организация данных является самой простой для реализации (Рис.5).
Рис.5. Централизованная организация данных
На одном сервере находится единственная копия базы данных. Все операции с БД обеспечиваются этим сервером. Доступ к данным выполняется с помощью удаленного запроса или удаленной транзакции. Достоинством данного способа является простая поддержка базы данных в актуальном состоянии. Недостатки централизованной организации данных:
- размер БД ограничен размером внешней памяти;
- все запросы направляются к одному серверу с соответствующими затратами на стоимость связи и временную задержку;
- ограничение на параллельную обработку;
- недоступность для удаленных пользователей при появлении ошибок связи;
- выход из строя при отказе центрального сервера.
Децентрализованная организация данных предполагает разбиение информационной базы на несколько физически распределенных БД. Каждый клиент пользуется своей БД, которая может быть либо частью общей информационной базы данных (Рис.6), либо копией информационной БД в целом (Рис.7), что приводит к ее дублированию для каждого клиента.
Рис.6. Децентрализованная организация данных
способом распределения
Рис.7. Децентрализованная организация данных
способом дублирования
При распределении данных на основе разбиения база данных размещается на нескольких серверах. Существование копий отдельных частей недопустимо. Достоинства метода:
- большинство запросов удовлетворяются локальными базами данных, что сокращает время ответа;
- увеличиваются доступность данных и надежность их хранения;
- стоимость запросов на выборку и обновление снижается;
- система остается частично работоспособной при выходе из строя одного из серверов.
Недостатки метода:
- часть удаленных запросов или транзакций может потребовать доступ ко всем серверам, что увеличивает время ожидания и цену обслуживания;
- хранение сведений о размещении данных в различных БД.
Деление базы данных наиболее целесообразно при совместном использовании локальных и глобальных компьютерных сетей.
Метод дублирования предполагает размещение на каждом сервере полной базы данных, что обеспечивает наибольшую надежность хранения.
Недостатки метода:
- повышенные требования к объему внешней памяти;
- усложнение корректировки БД.
Достоинства метода:
- быстрый доступ в результате локального выполнения запросов;
- высокая надежность хранения данных.
Метод дублирования используется, когда фактор надежности является критическим, БД небольшая, интенсивность обновления невелика.
Смешанная организация хранения данных объединяет два способа распределения: разбиение и дублирование (Рис.8).
Появляется необходимость хранить информацию о том, где находятся данные в сети. При этом достигается компромисс между объемом памяти под БД в целом и под БД на каждом сервере, чтобы обеспечить надежность и эффективность работы. Данный метод легко реализует параллельную обработку, т.е. обслуживание распределенного запроса или транзакции.
Несмотря на гибкость смешанного способа организации данных, остается проблема взаимозависимости факторов, влияющих на производительность системы, проблема ее надежности и выполнения требований к памяти. Смешанный способ организации данных можно использовать только при наличии сетевой СУБД.
Рис.8.Смешанная организация данных
В базах данных коллективного пользования центральным технологическим звеном становятся серверы баз данных. Программные средства серверов баз данных обеспечивают:
- реализацию многопользовательских приложений;
- централизованное хранение данных;
- целостность и безопасность данных.
Производительность серверов баз данных на порядок выше по сравнению с файл-серверами, которые используются в локальных вычислительных сетях. Использование серверов баз данных обеспечило доступ многих пользователей к одним и тем же файлам, что послужило предпосылкой создания сетевых СУБД.
Мощность сетевых СУБД, основанных на файл-сервере, в настоящее время недостаточна. В нагруженной вычислительной сети неизбежно падает производительность, нарушаются безопасность и целостность данных.
Технология клиент-сервер, как более мощная, заменила технологию файл-сервер и позволила совместить достоинства однопользовательских систем (высокий уровень диалоговой поддержки, дружественный интерфейс, низкая цена), с достоинствами более крупных компьютерных систем (поддержка целостности, защита данных, многозадачность).
В классическом понимании СУБД представляет собой набор программ, позволяющих создавать и поддерживать базу данных в актуальном состоянии. Функционально СУБД состоит из трех частей:
- ядра (базы данных);
- языка;
- инструментальных средств программирования.
Инструментальные средства программирования относятся к интерфейсу клиента, или внешнему интерфейсу и могут включать процессор обработки данных на языке запросов.
Язык – это совокупность процедурных и непроцедурных команд, поддерживаемых СУБД. Наиболее часто используются SQL, QBE.
Ядро выполняет все функции по обработке БД.