В модели данных будут присутствовать таблица фактов и три таблицы измерений: времени, вида страхового продукта, название филиала.
В таблице фактов будет 4 поля – 3 внешних ключа ATE_ID, VID_ID, TIME_ID и поле VZNOS – сумма поступлений взносов.
В двух таблицах измерений будут справочники филиалов и видов продуктов (идентификатор + название).
Таблица измерения «Время» будет иметь 3 поля TIME_ID, YEAR, QUARTER.
Рисунок. 6 Схема «звезда»
6. Определение отношений.
Соединяем таблицы измерений отношениями «один ко многим» с таблицей фактов. Получили схему «звезда» (рис. )
7. Модель процесса загрузки.
Мы переносим следующие данные:
КодАТЕ ATE2.ATE2_2 - ATE.ATE_ID
Название филиала ATE2.ATE2_5 -ATE.NAME
Сумма поступлений DAT_OTCH.A6 -VZNOS.VZNOS
Таблицу TIME заполняем значениями года: 1998,1999. И соответсвенно значениями квартала от 1 до 4.
8. Модель приложения.
Информация пользователю будет представляться в виде таблиц, графиков или диаграмм. Например (табл. ):
Взносы | Филиал | ||
Год | Вид страхования | Кукморский | Общий итог * |
1999 | Добровольное страхование имущества физ. лиц | 382778 | 7245476,5 |
Добровольное страхование имущества юр. лиц | 439245 | 8615743,6 | |
Добровольное страхование ответственности юр. лиц | 401766 | 7367026,9 | |
Обязательное страхование имущества физ. лиц | 58968 | 9172973,7 | |
Обязательное страхование пассажиров | 141150 | 9345879 | |
Прочие виды обязательного страхования | 74073 | 9279667 | |
Страхование жизни: по правилам №23 | 131609,5 | 8225452,7 | |
Страхование жизни: пожизненное | 113449,5 | 7448453,5 | |
Страхование жизни: семейное | 109720,5 | 8032250,7 | |
Страхование жизни: смешанное | 107079,5 | 9966974,3 | |
1999 Всего * | 1959839 | 84699897,9 | |
Общий итог * | 3953311 | 160045472,8 |
Таблица. 13 Табличный способ представления информации
9. Определение архитектуры.
В связи с тем, что у проекта очень ограничен бюджет, то в качестве
платформы было выбрано решение фирмы Microsoft на базе Wintel:
- Windows 2000 Server;
- Microsoft SQL Server 7.0 Enterprise Edition;
- Microsoft OLAP Services;
- MSExcel’2000 из русифицированного пакета MSOffice’2000.
При невысокой цене это решение дало нам всю необходимую функциональность. А знакомство пользователей с пакетом МSOffice’97 сводит их обучение к минимуму.
10. Построение базы данных.
Используя SQLServerEnterpriseManager создаем базу данных “TASFIR”, используя мастер. Указываем размер базы 50 Mb и размер приращения 5 Mb.
11. Загрузка данных.
Используя DataTransformationServices (DTS) – сервисы преобразования данных, загрузим данные в базу данных TASFIR согласно модели процесса загрузки. DTS работает в виде мастера импорта. Здесь необходимо указать в качестве источника (Source) – DbaseIV и указать в пути каталог нахождения исходных таблиц. В качестве приемника будет выступать MicrosoftOLEDBProviderforSQLServer, необходимо указать название нашей БД TASFIR. Далее выбираем те таблицы, которые участвуют в переносе и обозначаем условия для переноса каждой таблицы и каждого поля. И производим перенос данных.
Запускаем OLAPManager для создания OLAP-куба. Создаем новую базу данных. Затем создаем новый куб с помощью мастера.
- создаем новый источник данных. Выбираем базу данных TASFIR, а в ней таблицу VZNOS.
- выбираем в качестве меры поле VZNOS базы данных VZNOS
- далее создаем новые измерения time, vid, ate. Причем создавая измерение time необходимо соблюсти иерархию и поставить год выше квартала
- далее называем куб TASFIR, здесь можно просмотреть как можно работать с кубом на тестовых данных
- открывается редактор куба, здесь можно отредактировать отношения между таблицами, удалить и добавить новые
- далее закрываем редактор и записываем куб
- получаем приглашение провести агрегирование данных тремя различными способами MOLAP, HOLAP, ROLAP. Выбираем первое, так как у нас маленькая база
- в следующем окне нажимаем старт и получаем график зависимости ускорения ответа на запросы (вследствие предварительного просчета агрегатов и их хранения) от того сколько дисковой памяти будет выделено под эти агрегаты.
- Далее запускаем процесс создания.
12. Тестирование. Запросы и отчеты.
В качестве клиентской части выступает MSExcel’2000 из русифицированного пакета MSOffice’2000.
Заходим Данные -Внешние данные - Создать запрос.
Далее отвечаем готово и расставляем наши меры и измерения по таблице. Меру в середину, а измерения в любом порядке. ВСЕ инструмент для тестового анализа готов.
Заключение.
1. Был проведен анализ организации хранилищ данных
2. Проведена оценка требуемого объема памяти и быстродействия в
аналитических системах в зависимости от организации данных.
3. Была разработана технология проектирования Хранилищ Данных
4. Разработан алгоритм создания Хранилища Данных
5. Апробация проведена в ведущей организации
6. Тестовый проект выполненнвсреде Windows 2000, на базе SQL Server 7.0 и MS Office 2000.
Приложение 1
Отчетные формы и диаграммы полученные
в результате тестирования системы