Смекни!
smekni.com

Технология хранилищ данных (стр. 11 из 11)

В модели данных будут присутствовать таблица фактов и три таблицы измерений: времени, вида страхового продукта, название филиала.

В таблице фактов будет 4 поля – 3 внешних ключа ATE_ID, VID_ID, TIME_ID и поле VZNOS – сумма поступлений взносов.

В двух таблицах измерений будут справочники филиалов и видов продуктов (идентификатор + название).

Таблица измерения «Время» будет иметь 3 поля TIME_ID, YEAR, QUARTER.

Рисунок. 6 Схема «звезда»

6. Определение отношений.

Соединяем таблицы измерений отношениями «один ко многим» с таблицей фактов. Получили схему «звезда» (рис. )

7. Модель процесса загрузки.

Мы переносим следующие данные:

КодАТЕ ATE2.ATE2_2 - ATE.ATE_ID

Название филиала ATE2.ATE2_5 -ATE.NAME

Вид продукта BOKOV1.VID_STR - VID.VID_NAME

BOKOV2.VID_STR - VID.VID_NAME

BOKOV3.VID_STR - VID.VID_NAME

Сумма поступлений DAT_OTCH.A6 -VZNOS.VZNOS

Таблицу TIME заполняем значениями года: 1998,1999. И соответсвенно значениями квартала от 1 до 4.

8. Модель приложения.

Информация пользователю будет представляться в виде таблиц, графиков или диаграмм. Например (табл. ):

Взносы Филиал
Год Вид страхования Кукморский Общий итог *
1999 Добровольное страхование имущества физ. лиц 382778 7245476,5
Добровольное страхование имущества юр. лиц 439245 8615743,6
Добровольное страхование ответственности юр. лиц 401766 7367026,9
Обязательное страхование имущества физ. лиц 58968 9172973,7
Обязательное страхование пассажиров 141150 9345879
Прочие виды обязательного страхования 74073 9279667
Страхование жизни: по правилам №23 131609,5 8225452,7
Страхование жизни: пожизненное 113449,5 7448453,5
Страхование жизни: семейное 109720,5 8032250,7
Страхование жизни: смешанное 107079,5 9966974,3
1999 Всего * 1959839 84699897,9
Общий итог * 3953311 160045472,8

Таблица. 13 Табличный способ представления информации

9. Определение архитектуры.

В связи с тем, что у проекта очень ограничен бюджет, то в качестве

платформы было выбрано решение фирмы Microsoft на базе Wintel:

- Windows 2000 Server;

- Microsoft SQL Server 7.0 Enterprise Edition;

- Microsoft OLAP Services;

- MSExcel’2000 из русифицированного пакета MSOffice’2000.

При невысокой цене это решение дало нам всю необходимую функциональность. А знакомство пользователей с пакетом МSOffice’97 сводит их обучение к минимуму.

10. Построение базы данных.

Используя SQLServerEnterpriseManager создаем базу данных “TASFIR”, используя мастер. Указываем размер базы 50 Mb и размер приращения 5 Mb.

11. Загрузка данных.

Используя DataTransformationServices (DTS) – сервисы преобразования данных, загрузим данные в базу данных TASFIR согласно модели процесса загрузки. DTS работает в виде мастера импорта. Здесь необходимо указать в качестве источника (Source) – DbaseIV и указать в пути каталог нахождения исходных таблиц. В качестве приемника будет выступать MicrosoftOLEDBProviderforSQLServer, необходимо указать название нашей БД TASFIR. Далее выбираем те таблицы, которые участвуют в переносе и обозначаем условия для переноса каждой таблицы и каждого поля. И производим перенос данных.

Запускаем OLAPManager для создания OLAP-куба. Создаем новую базу данных. Затем создаем новый куб с помощью мастера.

- создаем новый источник данных. Выбираем базу данных TASFIR, а в ней таблицу VZNOS.

- выбираем в качестве меры поле VZNOS базы данных VZNOS

- далее создаем новые измерения time, vid, ate. Причем создавая измерение time необходимо соблюсти иерархию и поставить год выше квартала

- далее называем куб TASFIR, здесь можно просмотреть как можно работать с кубом на тестовых данных

- открывается редактор куба, здесь можно отредактировать отношения между таблицами, удалить и добавить новые

- далее закрываем редактор и записываем куб

- получаем приглашение провести агрегирование данных тремя различными способами MOLAP, HOLAP, ROLAP. Выбираем первое, так как у нас маленькая база

- в следующем окне нажимаем старт и получаем график зависимости ускорения ответа на запросы (вследствие предварительного просчета агрегатов и их хранения) от того сколько дисковой памяти будет выделено под эти агрегаты.

- Далее запускаем процесс создания.

12. Тестирование. Запросы и отчеты.

В качестве клиентской части выступает MSExcel’2000 из русифицированного пакета MSOffice’2000.

Заходим Данные -Внешние данные - Создать запрос.

Далее отвечаем готово и расставляем наши меры и измерения по таблице. Меру в середину, а измерения в любом порядке. ВСЕ инструмент для тестового анализа готов.

Заключение.

1. Был проведен анализ организации хранилищ данных

2. Проведена оценка требуемого объема памяти и быстродействия в

аналитических системах в зависимости от организации данных.

3. Была разработана технология проектирования Хранилищ Данных

4. Разработан алгоритм создания Хранилища Данных

5. Апробация проведена в ведущей организации

6. Тестовый проект выполненнвсреде Windows 2000, на базе SQL Server 7.0 и MS Office 2000.

Библиографический список.

1. Inmon W.H. Building the Data Warehouse // Wellesley, MA.: QED Publishing Group, 1992

2. Codd E.F., Codd S.B., Salley C.T., E.F.Codd & Associates. Providing OLAP
(On-Line Analytical Processing) to User-Analysts: An IT Mandate. - 1993.

3. DePompa B. Основные тенденции развития информационных хранилищ
//COMPUTERWORLD MOSCOW. – 1996. - №16

4. DePompa B. Хотите получить прибыль - разберитесь со своими данными.
// COMPUTERWORLD MOSCOW. – 1997. - №13

5. MicrosoftCorporation Компьютерные сети. Учебный курс. – М. Русская
редакция,1997. – 696 с.

6. Raden N.Моделирование информационных хранилищ //
COMPUTERWORLD MOSCOW. – 1996. - №16

7. Артемов Д., Погульский Г., Альперович М. MicrosoftSQLServer 7.0 для профессионалов. – М.: Русская редакция, 1999. – 576 с.

8. Баронов В.В. Автоматизация управления предприятиям. – М.: ИНФРА-М, 2000. – 239 с.

9. Бритов П.А., Липчинский Е.А. Практика построения Хранилищ Данных:
Система SAS //СУБД. - 1998. - №4-5

10. Буров К. Обнаружение знаний в хранилищах данных // Открытые
Системы. - 1999. - №5-6

11. Ганьон Габриэль Хранилища данных: краткий обзор // PCMagazine/RE. –
1999. - №10

12. ГарбусДж., ПаскузиД., ЧангЭ. Database Design on SQL Server 7. Сертификационный экзамен – экстерном (экзамен – 70-029). – СПб.: Питер, 2000. – 560 с.

13. Дейт К. Дж. Введение в системы баз данных. – К : Диалектика, 1998. – 784 с.

14. Джулия Борт Витринам данных не мешает похудеть // Директору
информационной службы. - 1999

15. Зельцер A. Информационные хранилища в сетях предприятий
//COMPUTERWORLD MOSCOW. – 1995. - №12

16. Иванов П. Индивидуальный маркетинг на плечах информационных
хранилищ // СomputerWeekly. – 1998. - №26-27

17. Калянов Г.Н. Консалтинг при автоматизации предприятия. – М.: СИНТЕГ, 1997. – 316 с.

18. Кречетов Н. Информационные хранилища: обзор технологий и
продуктов //COMPUTERWORLD MOSCOW. – 1996. - №16

19. Кречетов Н. Информационные хранилища //COMPUTERWORLD
MOSCOW. – 1995. - №12

20. Кристин К. Корпоративная отчетность. Серверная архитектура для
распределенного доступа к информации //Открытые Системы - 1999 - №1.

21. Кузин Ф.А. Магистерская диссертация. Методика написания, правила оформления и процедура защиты.Практическое пособие для студентов-магистрантов. – М.: Ось-98, 1997. – 304 с.

22. Липаев В.В. Системное проектирование сложных программных средств для информационных систем. – М.: СИНТЕГ, 1999. – 224 с.

23. Львов В. Создание систем поддержки принятия решений на основе
хранилищ данных // СУБД. – 1997. - №3

24. Маклаков С.В. CASE-средства разработки информационных систем: BPwin, ERwin. – М.: ДИАЛОГ-МИФИ, 2000. – 256 с.

25. Наталья Д. Устройство и назначение хранилищ данных // Открытые
Системы. - 1998. - №4-5

26. Найгель П. Истоки сегодняшних продуктов OLAP.(перевод Абушаева Ш)
// THEOLAPREPORT. – 1999

27. Найгель П. Как не купить OLAP продукт. (переводАбушаеваШ.) // THE
OLAP REPORT. – 1999

28. Пржиялковский В. Data Warehouse — почувствуйте себя принимающим
решение //Директору информационной службы. – 2000

29. Рекорд Сара. Строя рентабельное хранилище данных // Informix
Magazine(русское издание). – 1998

30. Роджерс Джефри Проверка достоверности данных при репликации //
WINDOWS 2000 MAGAZINE. - 1999. – №3

31. Саймон А.Р. Стратегические технологии баз данных: менеджмент на 2000 год. – М.: Финансы и статистика, 1999. – 479 с.

32. Сахаров А.А. Концепции построения и реализации информационных
систем, ориентированных на анализ данных // СУБД. – 1996. - №4

33. Сахаров А.А. Принципы проектирования и использования многомерных
баз данных (на примере Oracle Express Server) // СУБД. – 1996. - №3

34. Сонькин А. Построение хранилища данных средствами Informix //
InformixMagazineRussian Edition. – 1998. - Апрель

35. Тао Ай Лей Три ареала хранилищ данных //COMPUTERWORLD
РОССИЯ. – 1999. - №24

36. Шапиро В.Д. Projectmanagement/Управление проектами: толковый англо-русский словарь-справочник. – М.: Высшая школа, 2000. – 379 с.

37. Щавелёв Л.В. Способы аналитической обработки данных для поддержки
принятия решений //СУБД. - 1998. - №4-5

Приложение 1

Отчетные формы и диаграммы полученные

в результате тестирования системы