В таблице "Посетители" находятся следующие поля: "Имя", "Код пользователя", "Дата регистрации". Их тип данных следующий: "Имя" - текстовый, "Код пользователя" - счетчик, "Дата регистрации" - дата/время. В данной таблице ключевым полем будет являться "Код пользователя".
Таблица "Разделы". Здесь ключевым полем будет являться "Номер раздела". Поля и тип их данных: "Номер раздела" - счетчик, "Имя раздела" - текстовый.
Следующая таблица имеет название "Посещения сайта". Ключевое поле - "Номер". Тип данных полей таблицы: "Код пользователя" - числовой, "Номер" - счетчик, "Дата и время входа" - дата/время, "Дата и время выхода" - дата/время, "IP- адрес" - текстовый.
Последняя таблица называется "Посещения раздела". Ключевое поле - "Номер". В ней 4 поля, которые имеют разные типы полей: "Номер" - счетчик, "Номер посещения" - числовой, "Номер раздела" - числовой и "Время посещения" - дата/время.
Установим связи между таблицами по ключевым полям (рисунок 1.4).
Рисунок 1.4 - Таблицы и межтабличные связи БД сайта crimusic. info, спроектированные в MSAccess
Таблица "Посетители" связана с таблицей "Посещения сайта" ключевым полем "Код пользователя" (связь между таблицами один ко многим).
Таблица "Посещения сайта" связана с таблицей "Посещения разделов" по полю "Номер посещения" (связь один ко многим).
Таблица "Разделы" связана с таблицей "Посещения разделов" отношением один ко многим.
1.3 OLAP-технологии в подсистеме анализа объекта исследований
Термин OLAP, или оперативная аналитическая обработка, был введен в 1993 г. Эдгаром Коддом (Edgar Codd), автором реляционной модели. Первоначально OLAP использовался как профессиональное словечко, обозначающее принципиальное отличие от OLTP (On-Line Transaction Processing, Оперативная обработка транзакций). Буква T была заменена на A, что подчеркивало аналитические возможности OLAP в отличие от транзакционных характеристик технологии реляционных баз данных. Сегодня термин OLAP используется родовое понятие для различных технологий, включая системы поддержки принятия решений, Business Intelligence и управленческие информационные системы.
Основная функция OLAP - управление измерениями, которые применяются для моделирования основных характеристик объекта исследований.
Управлять этими измерениями несложно, во-первых, потому что манипулирование выполняется с помощью графического интерфейса. Во-вторых, внесенные изменения переносятся на все задействованные данные, хранящиеся в базе данных OLAP.
С помощью OLAP-технологий можно легко создавать и рассматривать "альтернативные отношения". При использовании же электронных таблиц одновременный просмотр всех измерений невозможен. В этом случае, данные, скорее всего, поступали бы в виде иерархии связанных электронных таблиц, причем каждая таблица более высокого уровня консолидировала и суммировала бы информацию таблиц более низкого уровня. Поскольку такие электронные таблицы оказываются несвязанными и не обеспечивают прозрачность всей модели, чрезвычайно сложно модифицировать модель в приемлемые временные сроки. Возможность визуального моделирований иерархий и управления ими, а также отображения различных представлений отношений между элементами измерений является неоспоримым преимуществом OLAP. В данной курсовой работе будет спроектирован OLAP- куб по данным посещения сайта: таблицы "Посетители", "Посещения сайта", "Разделы", "Посещения разделов".
Он схематично представлен на рисунке 2.1
Рисунок 2.1 - OLAP– куб
Оси построенного OLAP- куба имеют названия: "имя пользователя", "Дата и время входа"
В результате пересечения размерностей данного OLAP-куба образовалась мера, то есть узловая точка. Этот агрегат называется "Длительность посещения".
Данный OLAP-куб был построен по следующим этапам:
Работа по построению OLAP куба начинается с построения сводной таблицы. в MicrosoftExcel через путь Данные - Сводная таблица.
Открывается Мастер сводных диаграмм и таблиц. В ней предложено, по каким данным можно создать таблицу. Выбираем вариант: по внешним источникам данных.
Чтобы извлечь данные из внешнего источника с помощью MicrosoftQuery, нажимаем кнопку "Получить данные". В появившемся окне Выбор источника данных выбираем Базы данных в MSAccess.
Необходимо выбрать созданную нами базу данных.
Появляется окно: Создание запроса: выбор столбцов. В нем имеющиеся созданными нами таблицы переносим в столбцы запроса.
Следующие окна по созданию запроса оставляем без изменений (отбор данных, порядок сортировки).
Когда мы доходим до окна Создание запроса: заключительный шаг следующим нашим действием будет - Вернуть данные в MSExcel.
Таким образом, мы получили данные. Далее в Мастере сводных таблиц и диаграмм выбираем, куда поместить таблицу.
В результате из списка полей свободных таблиц перетаскиваем элементы в сводную таблицу. Соответственно в поля строк - "Имя" и "Дата и время входа", а в элементы данных - "Длительность". Также необходимо выбрать окне Вычисление поля сводной таблицы операцию: Сумма для агрегата "Длительность". Далее следует изменить формат ячеек данной меры на "Время".
Таким образом, был сформирован OLAP-куб.
Основной целью создания базы данных в данной курсовой работе является облегчение поиска информации. База данных изучаемого объекта, то есть веб-сайта crimusic. info содержит сведения о посещении пользователями главной страницы и отдельных разделов. Составление таблиц в соответствии с этапом 1.2 - СУБД MicrosoftAccess в разработке базы данных объекта исследований. Для начала необходимо составить таблицы, которые должна содержать данная база данных. В этой работе их четыре. Итак, таблица "Посетители" изображена на рисунке 2.1
Рисунок 2.1 - Таблица "Посетители"
В таблице "Посетители" находятся следующие поля: "Имя", "Код пользователя", "Дата регистрации". Их тип данных следующий: "Имя" - текстовый, "Код пользователя" - счетчик, "Дата регистрации" - дата/время. В данной таблице ключевым полем будет являться "Код пользователя".
Таблица "Разделы". Здесь ключевым полем будет являться "Номер раздела". Поля и тип их данных: "Номер раздела" - счетчик, "Имя раздела" - текстовый. (Рисунок 2.2)
Рисунок 2.2 - Таблица "Разделы"
Следующая таблица имеет название "Посещения сайта" и изображена на рисунке 2.3 Ключевое поле - "Номер". Тип данных полей таблицы: "Код пользователя" - числовой, "Номер" - счетчик, "Дата и время входа" - дата/время, "Дата и время выхода" - дата/время, "IP- адрес" - текстовый.
Рисунок 2.3 - Таблица "Посещения сайта"
Таблица "Посещения раздела". Ключевое поле - "Номер". В ней 4 поля, которые имеют разные типы полей: "Номер" - счетчик, "Номер посещения" - числовой, "Номер раздела" - числовой и "Время посещения" - дата/время.
Рисунок 2.4 - Таблица "Посещения разделов"
Определим связи между таблицами.
Таблица "Посетители" связана с таблицей "Посещения сайта" следующим ключевым полем - "Код пользователя". Связь между таблицами один ко многим и она изображена на рисунке 2.5
Рисунок 2.5 - Связь между таблицами "Посетители" и "Посещения сайта"
Таблица "Посещения сайта" связана с таблицей "Посещения разделов" по полю "Номер посещения". Связаны они как один ко многим. (Рисунок 2.6)
Рисунок 2.6 - Связь между таблицами "Посещения сайта" и "Посещения разделов"
Таблица "Разделы" связана с таблицей "Посещения разделов" отношением один ко многим по полю "Номер раздела". Такая связь изображена на рисунке 2.7