Смекни!
smekni.com

Принципы реализации машин БД (стр. 3 из 6)

Особый интерес приобретает создание систолических МВД в связи с появлением серийных однокристальных транспьютеров, содержащих наряду с процессором и памятью каналы (порты ввода-вывода). Например, промышленный транспьютер фирмы INMOS IMS Т414 имеет следующие характеристики. В одном кристалле реализован 32-разрядный процессор быстродействием до 10 млн. опер./с, статическое ОЗУ на 2 Кбайт, четыре канала связи, 32-разрядный интерфейс памяти и контроллер динамического ОЗУ. Конструктивно транспьютерная матрица, являющаяся основным элементом систолических транспьютерных МВД (см. рис. 5), может быть реализована посредством серийных транспьютерных плат IMS ВОООЗ той же фирмы. Эта двойная европлата содержит четыре транспьютера Т414, связанных между собой портами связи, четыре устройства динамической памяти по 256 Кбайт каждое и четыре внешних порта ввода-вывода. Возможно, в ближайшее время применение таких транспьютерных плат переведет проекты систолических МВД из области теоретических исследований в область практической реализации.

Основной проблемой в распределенных (сетевых) МБД является оптимальная кластеризация данных по локальным УМП и поддержка соответствующей распределенной индексации. В GAMMA, например, предлагается кластеризация каждого отношения по всем УМП (в соответствии с хешированием значенийключевых атрибутов и созданием распределенного по УМП индекса этих значений). В NODD предлагается равномерное распределение отношений по узлам решетки. Между конкретными кортежами разных отношений, для которых действуют семантические связи, существуют указатели, задающие расположение связанных кортежей (номера узлов и их адреса в УМП). Таким образом, запрос в БД возбуждает связи между кортежами в узлах решетки и порождает поток данных между ними. Это позволяет реализовать в такой МВД потоковую обработку сложных запросов на основе модели «активного графа»

К классу сетевых относится коммерческая МВД фирмы Teradata DBC 1012, которая интенсивно распространяется и находит широкое применение в разлиных информационных системах. На рис. 6 изображена конфигурация DBC 1012 с восемью обрабатывающими процессорами ПМД (на базе i80386), каждый из которых имеет НМД и подключается к коммуникационной сети типа двоичного дерева (Y-сеть). В узлы этой сети встроены сетевые высокоскоростные процессоры и программируемые логические матрицы, реализующие функции управления сетью. Y-сеть позволяет осуществлять дуплексный обмены между обрабатывающими процессорами. В эту же сеть подключаются коммуникационные процессоры (ИЛ) для осуществления интерфейса с главной ЭВМ. Каждый обрабатывающий процессор обеспечивает поддержку всех операций реляционной алгебры, достаточных для выполнения операторов SQL, поддержку своей части БД, а также выполнение всех функций управления транзакциями над своей частью БД, в том числе защиту целостности, восстановления и т. д. Образцы DBC 1012 включают до 128 процессоров и имеют распределенную по обрабатывающим процессорам полупроводниковую память емкостью 412 Мбайт на один процессор. Общая емкость массовой памяти составляет до 1000 Гбайт и общее быстродействие - до 10^9 опер./с.

Два свойства DBC 1012 характерны для всех сетевых МЕД:

обеспечение возможности увеличения мощности наращиванием числа обрабатывающих процессоров, так что производительность при этом растет линейно (показатель линейности роста производительности DBC 1012 от числа процессоров составляет 97%);

обеспечение надежности функционирования за счет дублирования данных в локальных УМП (т. е. обеспечивается работа без краха системы при выходе из строя отдельных процессоров или УМП).

Третье направление исследований в области МБД заключается в создании недорогих коммерческих устройств на серийных процессорных элементах с шинным интерфейсом (топология таких МБД изображена на рис. 2,а). В качестве примера рассмотрим МБД фирмы Britton Lee IDM 500, структурная схема которой изображена на рис. 7. Хотя эти изделия не ориентированы на высокопараллельную обработку и содержат ограниченное число функциональных процессоров, они удовлетворяют сформулированным выше принципам МН МБД и полностью реализуют все основные функции МБД. Структурная схема коммерческих МБД является частным случаем МН МБД (см. рис. 2,a). Роль СБП выполняет полупроводниковая память, к которой через общую шину подключаются периферийные контроллеры НМД со встроенными микропроцессорами AMD 2901, процессор обработки (процессор БД) на основе Z8002 и до 8 канальных процессоров для подключения к главной ЭВМ (канал IBM 370, интерфейс с VAX 750) или подключения к локальной сети (Ethernet). Кроне того, к общей шине может подключаться особый функциональный процессор (акселератор БД) для выполнения тех операций, которые являются узким местом (например, сортировка отношений). Старшая модель IDM SOO/XL с емкостью внешней памяти более 1 Гбайт на жестких МД и 500 Мбайт на МЛ имеет производительность 1000 транзакций/мин и одновременно обслуживает до 400 пользователей.

Развитием этого направления в разработках фирмы Britton Lee явился реляционный файлсервер (data/file server) RS310 - автономное устройство, подключаемое к локальной сети Ethernet или непосредственно к главной ЭВМ по интерфейсу RS232. Он включает:

собственно процессор базы данных (1 плата) на основе 28000 (10 Мгц); соединенную с этим процессором оперативную память емкостью 1 Мбайт на одной плате;

два жестких диска типа винчестер (5 1/4 дюйма) по 80 Мбайт каждый с соответствующим контроллером;

контроллер кассетной МЛ с 60 Мбайт на кассете (Streaming tape 1/4 дюйма);

до четырех интерфейсных плат двух типов (интерфейс RS232 с восемью выходами или интерфейс локальной сети Ethernet).

Каждая интерфейсная плата содержит процессор 28000 и свою локальную память. ,RS310 может быть использован или как автономная СУБД с выходным языком SQL, поддерживая при этом все функции СУБД, за исключением первого этапа трансляции с SQL (управление транзакциями, параллельное выполнение запросов, откаты и восстановления, автоматическую оптимизацию запросов и т. п.), или как интегрированная система управления файлами. При этом RS310 выступает для главной ЭВМ в качестве интеллектуального контроллера с буферизацией и удовлетворяет интерфейсу SCSI (Small Computer System Interface). RS310 обеспечивает одновременную работу до 50 пользователей и выполняет одновременно до 10 запросов. Ближайшая перспектива развития RS310 - увеличение внешней памяти до восьми НМД емкостью 478 Мбайт и МЛ емкостью 300 Мбайт.

Рис. 8. Специализированная машина для БД PYRAMID S 9810 (9820)

Дальнейшим развитием такого подхода к созданию коммерческих МБД является их реализация на модульной параллельной мультимикропроцессорной системе типа систем S27 и S81 фирмы Sequent и систем серии 9000 (9810, 9820) фирмы Pyramid-Sybase. На рис. 8 изображена структурная схема нового изделия фирмы Pyramid--система 9810(9820), являющаяся специализированной ЭВМ для БД. Эта специализированная машина предназначена для автономной поддержки СУБД Sybase с входным языком SQL, а также для поддержки прикладных информационных систем на основе этой СУБД для автоматизации конторской деятельности, разработки программного обеспечения и т. п. Система работает как data computer в сети ЭВМ и имеет интерфейс не только с локальной сетью Ethernet, но и Х25, telenet, darpa. Общая дисковая память достигает 15 Гбайт. Основная память, подключаемая к устройству управления памятью в виде плат до 4 и 16 Мбайт, может наращиваться до 128 Мбайт. В системе поддерживается виртуальное адресное пространство 4 Гбайт со страницами в 2048 байт. В качестве процессоров обработки выступают один или два спецпроцессора (CPU), реализованные в виде 32-разрядных процессоров с RISC-архитектурой. CPU имеет следующие характеристики:

время цикла- 100 нс;
число 32-разрядных регистров - 528;
кэш-память инструкции- 16 Кбайт;
кэш-память - 64 Кбайт.

В RISC-процессорах реализован конвейерный режим выполнения инструкций.

Основой системы является собственная сверхбыстрая шина xtend
(40 Мбайт/с), работающая по принципу коммутации сообщений. Интеллектуальный процессор ввода-вывода (ПВВ) реализован на базе микропроцессора AMD 29116 с быстродействием 5 млн. опер./с и содержит 14 параллельных ОМА-контроллеров, общая пропускная способность которых 11 Мбайт/с. ПЕВ обслуживает периферийные устройства, контроллеры НМД (скорость передачи в которых до 2,5 Мбайт/с) и контроллеры локальной сети (КЛС).

К общей шине подключается до 16 портов с интерфейсом RS232 для обслуживания интеллектуальных терминальных процессоров, с помощью которых к системе могут подключаться терминальные пользователи. Подключение к шине адаптера шины MULTIBUS открывает широкие возможности для подключения вспомогательных внешних устройств, в которых реализован интерфейс этой шины.

Управление системой осуществляется процессором поддержки системы, в функции которого входят также диагностика всех устройств и системы в целом, сервисная служба системы и т. п. В этом процессоре функционирует так называемая двухпортовая многопроцессорная операционная система, которая соединяет в себе две версии UNIX ОС: System V. AT&T и 4.0 Berkly.

Перспективы развития МБД

Создание высокопроизводительных МВД связывается с решением следующих проблем, по которым ведутся интенсивные исследования.

1. Создание специализированных архитектур МВД, сочетающих достоинства горизонтального параллелизма при выполнении одной операции с функциональным параллелизмом при выполнении последовательности операций и транзакций. Особую роль здесь играет реализация конвейерной потоковой обработки (data flow) применительно к операциям реляционной алгебры.