Решение принятое на основе только одной точки зрения, может быть неэффективным или неверным. ХД позволяют интегрировать информацию, отражающую разные точки зрения на одну предметную область.
Оперативные источники данных, как правило, разрабатываются в разное время и с использованием различных инструментариев. Это приводит к тому, что одни и те же объекты описываются по-разному. Интеграция данных в ХД позволяет решить эту проблему, приводя данные к единому формату.
Требования к оперативным источникам данных накладывают ограничение на время хранения в них данных, то есть, те данные, которые не нужны для оперативной обработки, могут удаляться из базы для уменьшения объема занимаемых ресурсов. Для анализа же требуются данные за максимально больший период времени. В отличие от баз данных, в ХД данные после загрузки только читаются, что позволяет существенно повысить скорость доступа к данным.
Выполнение сложных аналитических запросов к оперативным источникам данных занимает большой объем ресурсов компьютеров, на которых они работают. Это приводит к снижению быстродействия системы, что недопустимо, так как время выполнения операций в таких системах часто весьма критично.
Таким образом, данные определенным образом подготовленные и собранные в ХД могут использоваться для анализа и принятия на их основе решений.
За формирование аналитических запросов к данным и представления результатов их выполнения в СППР отвечают подсистемы анализа (OLAP, Data Mining).
Упрощенным вариантом Хранилища данных является Витрина данных (ВД).
ВД максимально приближена к конечному пользователю и содержит данные, тематически ориентированные на него (например, ВД для работников отдела маркетинга может содержать данные, необходимые для маркетингового анализа).
ВД значительно меньше по объему, чем ХД, и для ее реализации не требуется больших затрат. Они могут быть реализованы как самостоятельно, так и вместе с ХД.
В процессе принятия решений пользователь генерирует некоторые гипотезы. Проверка гипотез осуществляется на основании информации об анализируемой предметной области. Как правило, наиболее удобным способом представления такой информации является зависимость между некоторыми параметрами. Например, зависимость объема продаж от региона, времени, категории товар и т.д.
В процессе анализа данных, поиска решений часто возникает необходимость в построении зависимостей между различными параметрами. Кроме того, число таких параметров может варьироваться в широких пределах. Традиционные средства анализа, оперирующие данными, которые представлены в виде таблиц, не могут в полной мере удовлетворять такими требованиям.
Для анализа информации наиболее удобным способом ее представления является многомерная модель или гиперкуб, ребрами которого являются измерения. Это позволяет анализировать данные сразу по нескольким измерениям, т.е. выполнять многомерный анализ.
С концепцией многомерного анализа данных тесно связывают оперативный анализ, который выполняют средствами OLAP-систем.
OLAP (On-Line Analytical Processing)- технология оперативной аналитической обработки данных, использующая методы и средства для сбора, хранения и анализа многомерных данных в целях поддержки процессов принятия решений.
Основное назначение OLAP-систем – поддержка аналитической деятельности, произвольных запросов пользователей-аналитиков. Цель OLAP-анализа – проверка возникающих гипотез.
OLAP-системы предоставляют аналитику средства проверки гипотез при анализе данных, то есть основной задачей аналитика является генерация гипотез, которую он решает ее, основываясь на своих знаниях и опыте.
Однако знания есть не только у человека, но и у накопленных данных, которые подвергаются анализу. Такие знания содержатся в огромной объеме информации, которую человек не в силах исследовать самостоятельно. В связи с этим существует вероятность пропустить гипотезы, которые могут принести значительную выгоду.
Для обнаружения «скрытых» знаний применяется специальные методы автоматического анализа - Добыча Данных (Data Mining) (ДД).
Методы ДД помогают решить многие задачи, с которыми сталкивается аналитик. К базовым методам ДД принято относить прежде всего алгоритмы, основанные на переборе и подходы, использующие элементы теории статистики.
Для обнаружения скрытых знаний в данных недостаточно просто применить методы ДД, хотя, безусловно, этот этап является основным в процессе интеллектуального анализа. Весь процесс состоит из нескольких этапов.
понимание и формулировка задачи анализа; На этом этапе происходит осмысление поставленной задачи и уточнение целей, которые должны быть достигнуты методами ДД. Правильно сформулированные цели и адекватно выбранные для их достижения методы в значительной степени определяют эффективность всего процесса.
подготовка данных для автоматизированного анализа; то есть приведение данных к форме, пригодной для применения конкретных выбранных методов ДД,
применение методов ДД и построение моделей; Сценарии применения могут быть самыми различными и включать сложную комбинацию разных методов, особенно если используемые методы позволяют проанализировать данные с разных точек зрения.
проверка построенных моделей; что дает судить об адекватности построенной модели.
интерпретация моделей человеком с целью их использования для принятия решений, добавления полученных правил и зависимостей в базы знаний.
Этим этапом и завершается цикл ДД в строгом смысле слова.
11.3Решение типовых задач посредством SCADA [18]- системы
Речь идет о новом направлении развития функций SCADA системы Trace Mode, основанного на интеллектуальных информационных технологиях и позволяющего существенно расширить область использования системы.
Современные SCADA-системы имеют схожие возможности и принципы функционирования, которые позволяют решить типовые задачи, такие как: диспетчерский мониторинг и сбор данных о протекании технологического процесса, управление при наличии четких алгоритмов и полной формализованной модели объекта управления. Однако, в случае, когда объектом мониторинга и управления является сложная динамическая многопараметрическая система, средств, предоставляемых традиционными SCADA-системами, становится недостаточно.
Необходимость в дальнейшем развитии SCADA-систем при управлении сложными техническими объектами и процессами обуславливается непрерывным возрастанием сложности управляемых объектов и процессов с одновременным сокращением времени, отводимого лицам оперативно-диспетчерского персонала на анализ проблемной ситуации, идентификацию возникшего отклонения от нормального (штатного) режима функционирования объекта, поиск возможных корректирующих решений по воздействию на объект, прогнозирование ситуаций, оценку последствий принимаемых решений и, наконец, выдачу команд на отработку необходимых управляющих воздействий.
Этот процесс требует много времени и высокой квалификации для того, чтобы точно и объективно оценить обстановку. При таком большом объеме информации, одновременно обрушивающейся на оператора, могут возникать ошибки. Анализ мирового опыта показывает, что при совершенствовании технологических процессов и автоматизации процесса принятия решений наиболее перспективным является использование информационных систем, основанных на знаниях, формализуемых в рамках технологии искусственного интеллекта и опыте высококвалифицированных специалистов, накапливаемом в базах знаний экспертных систем.
Актуальной задачей при построении автоматизированных систем реального времени является перенос функций диспетчера по анализу данных, прогнозированию ситуаций и принятию соответствующих решений на компоненты интеллектуальных систем поддержки принятия и исполнения решений (СППИР). Концепция систем поддержки принятия и исполнения решений включает целый ряд средств, объединенных общей целью - способствовать принятию и реализации рациональных и эффективных управленческих решений. СППИР - это диалоговая автоматизированная система, выступающая в качестве интеллектуального посредника, поддерживающего естественно-языковый интерфейс пользователя со SCADA-системой, использующая правила принятия решений и соответствующие модели с базами знаний. Она организует удобный диалог SCADA-системы с пользователем, “ведет” его по этапам анализа информации, распознавания и прогнозирования ситуаций, анализирует параметры технологического процесса, помогает выбрать наилучшие решения в зависимости от возникшей ситуации, реализует их путем выдачи управляющих воздействий, корректируя тем самым ход технологического процесса и оптимизируя его параметры по заданному критерию.
Основными структурными составляющими СППИР являются база знаний и механизм логического вывода. База знаний предназначена для хранения совокупности фактов, закономерностей, отношений (знаний), описывающих проблемную область, и правил, описывающих целесообразные формы структурирования, формализации и преобразования знаний в этой области.
Механизм логического вывода представляет собой совокупность способов применения правил вывода. Используя текущие или промежуточные исходные данные (факты) и знания из базы знаний, формирует последовательность правил, которые, будучи применены к исходным данным (фактам), полученным от SCADA-системы в результате контроля состояния технологического процесса, приводят к решению конкретной задачи диагностики, прогнозирования и регулирования параметров технологического процесса.