информационной безопасности;
масштабируемости;
открытости;
многомерного и многовариантного представления данных;
интеллектуального интерфейса;
интегрируемости с основными платформами и бизнес-приложениями, интеграция данных из разнообразных источников, сетевая интеграция (прежде всего web);
обеспечивают сервис по «очистке» данных при их загрузке в хранилища.
Отличительной особенностью рассматриваемых продуктов является значительная большая, чем в случае с ERP-системами, готовность к немедленной работе (значительно меньшие циклы внедрения при наличии наследуемых баз данных).
Целевые результаты
Результаты выполнения проектов целевым образом соответствуют предоставлению возможности получения ответов на вопросы:
здоров ли бизнес?
кто мой лучший клиент?
какой мой лучший продукт или услуга?
какого поставщика мне выгодно выбрать и почему?
где мы типично не укладываемся в сроки и почему?
какова эффективность деятельности нашего персонала?
какая дочерняя компания внесла наибольший (наименьший) вклад в результат?
что показывает анализ фондоотдачи оборудования?
какой сценарий и подход выбрать при слиянии (реструктуризации) компаний?
Аналитические методы дают конечному пользователю возможность осуществить весь цикл работы с исходными данными, имеющими большие объемы и невыясненную статистическую структуру. Этот цикл называется разведкой данных (Data Mining) и состоит из нескольких этапов: выборка, исследование, модификация, моделирование, оценка результатов (Sample, Explore, Modify, Model, Assess).
Средства Data Mining дают возможность ставить и решать как традиционные, так и нетрадиционные задачи анализа. Например, традиционной является постановка задачи: «Определить, имеется ли статистическая связь между такими показателями, как объем производства товара и объем его реализации (продажи)».
Нетрадиционной же была бы следующая постановка задачи: «Имеется несколько десятков (или даже сотен) показателей деятельности предприятия, и необходимо определить, между какими из них следует искать статистические связи вообще, какого рода связи следует искать (считать ли показатели равноправными, или считать одни показатели независимыми, а другие зависимыми переменными), на каких объектах эти связи проявляются».
При работе приложения на этапе выборки происходит формирование подмножества наблюдений из исходных данных (отбор по критериям или случайный отбор). На этапах исследования и модификации могут быть осуществлены: фильтрация данных, отбрасывание данных с большими выбросами, преобразование исходных переменных. На этапе моделирования осуществляется построение регрессий и оптимизация подмножества переменных, принятие решений на основе методик нейронных сетей, реализующих различные алгоритмы обучения классификации объектов, построение классификационных деревьев для отбора оптимального набора переменных и оптимального разбиения множества объектов, кластеризация и оптимальная группировка объектов. Наконец, на этапе обзора и оценки результатов пользователь имеет возможность сопоставить различные результаты моделирования, выбрать оптимальные класс и параметры моделей, представить результаты анализа в удобной форме.
В начале пути
Если говорить о практике внедрения рассмотренных систем и информационных технологий в России, то она находится в самом зачаточном состоянии. Опыт автора статьи по проведению подготовительной работы к внедрению рассматриваемых продуктов показал, что, с одной стороны, на украинских предприятиях исторические данные недооцениваются, а имеющиеся базы данных часто очень «бедны» для извлечения из них значимой информации, т.к. разрабатывались для решения учетных, а не управленческих задач. С другой стороны, очень ограничены возможности извлечения знаний из данных вследствие большой скорости изменений законодательной базы, что очень сильно искажает временную статистику.
11.1. Качество систем поддержки принятия решений
Большой объем данных, необходимость их структурирования для последующего анализа, подготовка информации для принятия решений, как с учетом регламента, так и оперативно – это те исходные предпосылки, чтобы воспользоваться нашим опытом и знаниями. СППР представляют собой системы, максимально приспособленные к решению задач повседневной управленческой деятельности.
В общем случае, затраты на управление состоят из фонда оплаты труда управленцев и стоимости информационного обеспечения деятельности управленцев. Однако, существуют еще два, возможно самых важных компонента затрат на управление, — это упущенная выгода от не принятых вовремя решений и оплата ошибочных решений. Причиной ошибочных управленческих решений или задержки в принятии решений, как правило, является либо отсутствие достоверной информации в момент принятия решения, либо отсутствие надлежащего контроля над специалистами, принимающими решения.
Качество системы управления может определяться следующим набором параметров процесса принятия решений:
· среднее время выработки решения (быстрота реакции);
· частота ошибочных решений (вероятность принятия неправильного решения);
· средние затраты на выработку решения;
· ущерб от необоснованных решений за определенный период;
· скорость обнаружения ошибок в принимаемых решениях.
Если при оценке целесообразности внедрения СППР опираться только на анализ прибыли на инвестируемый в автоматизацию капитал, то исказится или пропадет весь смысл совершенствования управленческих процессов. Цена достижения (вследствие совершенствования параметров процесса принятия решений) таких целей, как повышение качества обслуживания заказчиков, рост конкурентоспособности, не поддается точному денежному измерению.
Выделяются 5 основных задач, решаемых при построении системы принятия решений: 1) найти данные; 2) собрать; 3) интегрировать; 4) расставить приоритеты (разбить на стадии); 5) представить в виде отчетов и прогнозов.
11.2. Задачи систем поддержки принятия решений
В настоящее время, когда процесс автоматизации различных видов деятельности пришел практически на каждое современное предприятие, вычислительные системы и компьютерные сети позволяют накапливать большие массивы данных. Большой объем информации, с одной стороны, позволяет выполнять более точные расчеты и делать подробный анализ, с другой –превращает поиск необходимых решений в сложную задачу.
В результате необходимости упростить задачу поиска решения появился целый класс программных систем, призванных облегчить работу по анализу данных. Такие системы принято называть системами поддержки принятия решений – СППР (DSS, Decision Support Systems).
Можно выделить три основные задачи, решаемые в СППР:
ввод данных;
хранение данных;
анализ данных.
Существующие информационные системы, построенные как системы управления базами данных (СУБД) достаточно успешно решают задачи ввода (сбора) информации в систему, хранения и поиска информации и частично - анализа.
Решение задачи хранения данных, а также преодоление определенной противоречивости требований к системам управления базами данных и системам, ориентированным на глубокий анализ информации, привело к возникновению и все более широкому использованию подхода, ориентированного на использование концепции хранилищ данных.
Основная же задача СППР – предоставить аналитикам инструмент для выполнения анализа данных. Система не генерирует правильные решения, а только предоставляет аналитику данные в соответствующем виде для изучения и анализа, именно поэтому такие системы обеспечивают выполнении е функции поддержки принятия решений.
Основная задача Системы поддержки принятия решения – предоставить аналитикам инструмент для выполнения углубленного анализа данных. По степени интеллектуальности обработки данных при анализе выделяют три класса задач анализа:
Информационно-поисковый. Система осуществляется поиск необходимых данных в соответствии с заранее определенными запросами. Этот класс задач решается построением систем информационно-поискового анализа на базе реляционных СУБД и статических запросов с использованием языка SQL.
Оперативно-аналитический. Система производит группировку и обобщение данных в любом виде, необходимом аналитику. Причем, в этом случае заранее невозможно предсказать необходимые аналитику запросы. Этот класс задач решается построением систем оперативного анализа с использованием технологии оперативной аналитической обработки данных OLAP, использующую концепцию многомерного анализа данных.
Интеллектуальный. Система осуществляет поиск функциональных и логических закономерностей в накопленных данных, построение моделей и правил, которые объясняют найденные закономерности и/или с определенной вероятностью прогнозируют развитие некоторых процессов. Этот класс задач решается построением систем интеллектуального анализа, реализующего методы и алгоритмы Data Mining.
В основе концепции Хранилища Данных (ХД) лежит идея разделения данных, используемых для оперативной обработки и для решения задач анализа.
Это разделение позволяет оптимизировать как структуры данных оперативного хранения для выполнения операций ввода, модификации, удаления и поиска, так и структуры данных, используемых для анализа (для выполнения аналитических запросов).
Разные оперативные источники данных (системы управления) могут содержать данные, описывающие одну и ту же предметную область с разных точек зрения (бухгалтерского учета, складского учета, планового отдела и т.д.).