Смекни!
smekni.com

Шпаргалка по Управление качеством (стр. 13 из 16)

Преимущества:

• Витрины данных можно внедрять достаточно быстро

• Витрины проектируются для ответов на конкретный ряд вопросов

Данные в витрине оптимизированы для использования определенными группами пользователей, что облегчает процедуры их наполнения, а также способствует повышению производительности

Недостатки:

• Данные хранятся многократно в различных витринах данных. Это приводит к дублированию данных и, как следствие, к увеличению расходов на хранение и потенциальным проблемам, связанным с необходимостью поддержания непротиворечивости данных

• Потенциально очень сложный процесс наполнения витрин данных при большом количестве источников данных

• Данные не консолидируются на уровне предприятия, таким образом, отсутствует единая картина бизнеса

Двухуровневое хранилище данных строится централизованно для предоставления информации в рамках компании. Для поддержки такой архитектуры необходима выделенная команда профессионалов в области хранилищ данных.Это означает, что вся организация должна согласовать все определения и процессы преобразования данных.

Преимущества:

• Данные хранятся в единственном экземпляре

• Минимальные затраты на хранение данных

• Отсутствуют проблемы, связанные с синхронизацией нескольких копий данных

• Данные консолидируются на уровне предприятия, что позволяет иметь единую картину бизнеса

Недостатки:

Данные не структурируются для поддержки потребностей отдельных пользователей или групп пользователей

• Возможны проблемы с производительностью системы

• Возможны трудности с разграничением прав пользователей на доступ к данным

Трехуровневое хранилище данных. Хранилище данных представляет собой единый централизованный источник корпоративной информации. Витрины данных представляют подмножества данных из хранилища, организованные для решения задач отдельных подразделений компании. Конечные пользователи имеют возможность доступа к детальным данным хранилища, в случае если данных в витрине недостаточно, а также для получения более полной картины состояния бизнеса.

Преимущества:

• Создание и наполнение витрин данных упрощено, поскольку наполнение происходит из единого стандартизованного надежного источника очищенных нормализованных данных

• Витрины данных синхронизированы и совместимы с корпоративным представлением. Имеется корпоративная модель данных. Существует возможность сравнительно лёгкого расширения хранилища и добавления новых витрин данных

• Гарантированная производительность

Недостатки:

• Существует избыточность данных, ведущая к росту требований на хранение данных

• Требуется согласованность с принятой архитектурой многих областей с потенциально различными требованиями (например, скорость внедрения иногда конкурирует с требованиями следовать архитектурному подходу)

33. Методы поддержки принятия решений: 1) информационный поиск.

Для поддержки принятия решений c помощью информационных технологий, включая анализ и выработку альтернатив, в СППР используются следующие методы:

1) информационный поиск;

2) интеллектуальный анализ данных;

3) извлечение (поиск) знаний в базах данных;

4) рассуждение на основе прецедентов;

5) имитационное моделирование;

6) генетические алгоритмы;

7) искусственные нейронные сети;

8) методы искусственного интеллекта

Информационный поиск (ИП) (англ. Information retrieval) — процесс поиска неструктурированной документальной информации и наука об этом поиске.

Термин «информационный поиск» был впервые введён Кельвином Муром в 1948 в его докторской диссертации, опубликован и употребляется в литературе с 1950.

Сначала системы автоматизированного информационного поиска, или информационно-поисковые системы (ИПС), использовались лишь для управления информационным взрывом в научной литературе.

Многие университеты и публичные библиотеки стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам.

Широкое распространение ИПС получили с появлением сети Интернет. У русскоязычных пользователей наибольшей популярностью пользуются поисковые системы Google, Яндекс и Рамблер.

34. Методы поддержки принятия решений: 2) интеллектуальный анализ данных.

Интеллектуальный анализ данных (англ. Data Mining) — выявление скрытых закономерностей или взаимосвязей между переменными в больших массивах необработанных данных. Подразделяется на задачи классификации, моделирования и прогнозирования и другие. Термин «DataMining» введен Григорием Пятецким-Шапиро в 1989 году.

Английский термин «Data Mining» не имеет однозначного перевода на русский язык (добыча данных, вскрытие данных, информационная проходка, извлечение данных/информации) поэтому в большинстве случаев используется в оригинале. Наиболее удачным непрямым переводом считается термин «интеллектуальный анализ данных».

DataMining включает методы и модели статистического анализа и машинного обучения, дистанцируясь от них в сторону автоматического анализа данных. Инструменты DataMining позволяют проводить анализ данных предметными специалистами (аналитиками), не владеющими соответствующими математическими знаниями.

35. Методы поддержки принятия решений: 3) извлечение (поиск) знаний в базах данных.

Извлечение (поиск) знаний в базах данных (KnowledgeDiscoveryinDatabases – KDD) ‑ процесс обнаружения полезных знаний в базах данных. Эти знания могут быть представлены в виде закономерностей, правил, прогнозов, связей между элементами данных и др. Главным инструментом поиска знаний в процессе KDD являются аналитические технологии DataMining, реализующие задачи классификации, кластеризации, регрессии, прогнозирования, предсказания и т.д.

Однако, в соответствии с концепцией KDD, эффективный процесс поиска знаний не ограничивается их анализом. KDD включает последовательность операций, необходимых для поддержки аналитического процесса. К ним относятся:

– Консолидация данных.

– Подготовка анализируемых выборок данных.

– Очистка данных от факторов, мешающих их корректному анализу.

– Трансформация – оптимизация данных.

– Анализ данных – применение методов и технологий DataMining

Интерпретация и визуализация результатов анализа, их применение в бизнес-приложениях

36. Методы поддержки принятия решений: 4) рассуждение на основе прецедентов.

Прецедент ‑ случай, имевший место ранее и служащий примером или оправданием для последующих случаев подобного рода. Вывод на основе прецедентов (CBRCase-BasedReasoning) является подходом, позволяющим решить новую задачу, используя или адаптируя решение уже известной задачи. Как правило, такие методы рассуждений включают в себя четыре основных этапа, образующие так называемый цикл рассуждения на основе прецедентов или CBR-цикл.

Основная цель использования аппарата прецедентов в рамках СППР и, в частности, систем экспертной диагностики сложных объектов, заключается в выдаче готового решения ЛПР для текущей ситуации на основе прецедентов, которые уже имели место в прошлом при управлении данным объектом или процессом.

37. Методы поддержки принятия решений: 5) имитационное моделирование.

Имитационное моделирование — это метод, позволяющий строить модели, описывающие процессы так, как они проходили бы в действительности. Такую модель можно «проиграть» во времени как для одного испытания, так и заданного их множества. При этом результаты будут определяться случайным характером процессов. По этим данным можно получить достаточно устойчивую статистику.

Имитационное моделирование — это метод исследования, при котором изучаемая система заменяется моделью с достаточной точностью описывающей реальную систему и с ней проводятся эксперименты с целью получения информации об этой системе. Экспериментирование с моделью называют имитацией (имитация — это постижение сути явления, не прибегая к экспериментам на реальном объекте).

Имитационное моделирование — это частный случай математического моделирования. Существует класс объектов, для которых по различным причинам не разработаны аналитические модели, либо не разработаны методы решения полученной модели. В этом случае математическая модель заменяется имитатором или имитационной моделью.

38. Методы поддержки принятия решений: 6) генетические алгоритмы.

Генетический алгоритм (англ. genetic algorithm) — это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путем последовательного подбора, комбинирования и вариации искомых параметров с использованием механизмов, напоминающих биологическую эволюцию. Является разновидностью эволюционных вычислений (англ. evolutionary computation).

Отличительной особенностью генетического алгоритма является акцент на использование оператора «скрещивания», который производит операцию рекомбинации решений-кандидатов, роль которой аналогична роли скрещивания в живой природе.

Описание алгоритма. Задача кодируется таким образом, чтобы её решение могло быть представлено в виде вектора («хромосома»). Случайным образом создаётся некоторое количество начальных векторов («начальная популяция»). Они оцениваются с использованием «функции приспособленности», в результате чего каждому вектору присваивается определённое значение («приспособленность»), которое определяет вероятность выживания организма, представленного данным вектором.