Смекни!
smekni.com

Компьютерные данные: типы данных, обработка и управление (стр. 2 из 3)

- Создается возможность комплексной автоматизации параметров АИС, возможное благодаря централизованному управлению базой данных.

- В случае централизованного управления базой данных упрощается стандартизация и унификация представления данных вАИС.

Основными недостатками, с которыми могут встретиться пользователи и разработчики программного обеспечения во время применения БД и СУБД, есть:

- дополнительные затраты аппаратных ресурсов (например памяти) во время размещения и работы СУБД;

- дополнительные затраты на установление и поддержку СУБД в рабочем состоянии;

- необходимость квалифицированного персонала для централизованного управления базой данных (администрации БД), а и также дополнительные затраты.

Современные СУБД могут поддерживать:

- разные типы представления данных и операции над ними (в том числе фактографических, документальных, картографических данных);

- естественное и эффективное представление вБД разных отношений между объектами (например, визуализация данных, которые характеризуются параметрами пространства и времени);

- проверку данных на непротиворечивость;

- дедуктивный вывод (дедуктивные БД);

- управление распределенными БД и интеграцию неоднородных БД;

- централизацию и интеграцию данных в сетях ПК.

Создавая базу данных, пользователь стремится привести в порядок информацию о разных признаках объектов и быстро получить выборку данных с произвольным соединением признаков. Сделать это возможно только если данные структурированные.

Структурирование - это введения соглашений о способах представления данных. Неструктурированными называют данные, записанные, например, в текстовом файле.

Архитектура информационной системы, организованной с помощью БД

Эффективность функционирования информационной системы во многом зависит от ее архитектуры. В настоящее время перспективной является архитектура клиент-сервер. В достаточно распространенном варианте она предполагает наличие компьютерной сети и распределенной базы данных, включающей БД корпоративную (БДК) и БД персональные (БДП). БДК размещается на компьютере-сервере, БДП размещаются на компьютерах сотрудников подразделений, являющихся клиентами корпоративной БД.

Сервером определенного ресурса в компьютерной сети называется компьютер (программа), управляющий этим ресурсом, клиентом — компьютер (программа), использующий этот ресурс.

В качестве ресурса компьютерной сети могут выступать, к примеру, базы данных, файловые системы, службы печати, почтовые службы. Тип сервера определяется видом ресурса, которым он управляет. Например, если управляемым ресурсом является база данных, то соответствующий сервер называется сервером базы данных.

Достоинством организации информационной системы по архитектуре клиент-сервер является удачное сочетание централизованного хранения, обслуживания и коллективного доступа к общей корпоративной информации с индивидуальной работой над персональной информацией. Структура распределенной БД, построенной по архитектуре клиент-сервер, показана на рис.

Корпоративная БД создается, поддерживается и функционирует под управлением сервера БД.

Для создания и управления функционированием персональных БД и приложений, работающих с ними, используются СУБД такие, например, как Microsoft Ассеss под ОС Windows, OpenOffice.org. Base под ОС Linux.

В зависимости от размеров организации и особенностей решаемых задач информационная система может иметь одну из следующих конфигураций:

• компьютер-сервер, содержащий корпоративную и персональные базы;

• компьютер-сервер и персональные компьютеры с БДП;

• несколько компьютеров-серверов и персональных компьютеров с БДП.

Использование архитектуры клиент-сервер дает возможность постепенного наращивания информационной системы предприятия, во-первых, по мере развития предприятия; во-вторых, по мере развития самой информационной системы.

Разделение общей БД на корпоративную БД и персональные БД позволяет уменьшить сложность проектирования БД по сравнению с централизованным вариантом, а значит, снизить вероятность ошибок при проектировании и стоимость проектирования.

Важнейшим достоинством применения БД в информационных системах является обеспечение независимости данных от прикладных программ. Это позволяет не обременять пользователей проблемами представления данных на физическом уровне: размещения данных в памяти, методов доступа к ним и т. д.

Такая независимость достигается поддерживаемым СУБД многоуровневым представлением данных в БД на логическом (пользовательском) и физическом уровнях. Иными словами, благодаря СУБД и наличию логического уровня представления данных обеспечивается отделение концептуальной (понятийной) модели БД от ее физического представления в памяти ЭВМ.

Основные шаги проектирования БД:

- Определить информационные потребности БД;

- Проанализировать объекты, которые нужно промоделироватьвБД.

Основные типы моделей данных

Ядром любой базы данных есть модель данных. Модель данных представляет собой великое множество структур данных, ограничений целостности и операций манипулирования данными. С помощью модели данных могут быть представленные объекты предметной области, взаимосвязи между ними. Модель данных - это совокупность структур данных и операций их обработки. Современная СУБД базируется на использовании иерархической, сетевой, реляционнойи объектно-ориентированноймоделях данных, комбинации этих моделей или на некотором их подмножестве.

Рассмотрим три основных типа моделей данных: иерархическую, сетевую, реляционнную и объектно-ориентированную.

Иерархическая модель данных. Иерархическая структура представляет совокупность элементов, связанных между собою по определенным правилам. Объекты, связанные иерархическими отношениями, образовывают ориентированный граф (перевернутое дерево), пример которого надається на рис.2. К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь. Иерархическую модель организовывает данные в виде древовидной структуры. Узел - это совокупность атрибутов данных, которые описывают некоторый объект. На схеме иерархического дерева узлы имеют вид вершин графа. Каждый узел на болеенизком уровне связан только с одним узлом, который находится на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), которая не подчинена никакой другой вершине. Зависимые (подчиненные) узлы находятся на втором, третьем и других уровнях. Количество деревьев вбазе данных определяется числом корневых записей.

Сетевая модель данных

Сетевая модель означает представление данных в виде произвольного графа. Достоинством сетевой и иерархической моделей данных является возможность их эффективной реализации по показателям затрат памяти и оперативности. Недостатком сетевой модели данных является высокая сложность и жесткость схемы БД, построенной на ее основе.

Реляционнаяна модель данных. Понятие реляционный (англ. relation - отношение) связанс разработками известного американского специалиста в области систем баз данных Э.Ф. Кодда. Эти модели характеризуются простотой структуры данных, удобной для пользователя формой представления в виде таблиц и возможностью использования аппарата алгебры отношений и реляционнного вычисления для обработки данных.

На языке математики отношение определяется таким образом. Пусть заданоn множеств D1,D2, ...,Dn. Тогда R есть отношение над этими множествами, если R есть множеством упорядоченных наборов вида <d1,d2,...,dn>, где d1 - элемент сD1 , d2 - элемент сD2 , ... , dn - элемент сDn. При этом наборы вида <d1,d2,...,dn> называются кортежами, а множества D1,D2, ...Dn - доменами. Каждый кортеж состоит из элементов, которые выбираются из своих доменов. Эти элементы называются атрибутами, а их значения - значениями атрибутов.

Итак, реляционнная модель ориентирована на организацию данных в виде двумерных таблиц, любаяиз которых имеет следующие свойства:

- каждый элемент таблицы - это один элемент данных;

- все столбцы втаблицы - однородные, т.е все элементы встолбце имеют одинаковый тип (символьный, числовой и т.п.);

- каждый столбец носит уникальное имя;

- одинаковые строки втаблицы отсутствуют.

Таблицы имеют строки, которые отвечают записям (или кортежам), а столбцы -атрибутам отношений (доменам, полям).

Следующие термины являются эквивалентными:

отношение, таблица, файл (для локальных БД);

кортеж, строка, запись;

атрибут, столбик, поле.

Объектно-ориентированные БД объединяют в себе две модели данных, реляционную и сетевую, и используются для создания крупных БД со сложными структурами данных.

РеляционнаяБДесть совокупностью отношений, которые содержат всю необходимую информацию и объединенную разными связями.

БД считается нормализованной, если выполняются следующие условия:

- каждая таблица имеет главный ключ;

- все поля каждой таблицы зависят только от главного ключа;

- в таблицах отсутствуют группы повторных значений.

Для успешной работы с многотабличными БД, как правило, надо установить между ними связи. При этом пользуются терминамими “базовая таблица» (главная) и “подчиненная таблица». Связь между таблицами получается благодаря двух полей, одно из которых находится в базовой таблице, а второе - в подчиненной. Эти поля могут иметь значение, которое повторяются. Еслизначение в связанном поле записи базовой таблицы и в поле подчиненной совпадают, то эти записи называются связанными.