Смекни!
smekni.com

Корпоративные базы данных экономических информационных систем (стр. 5 из 5)

5. Индуктивные выводы позволяют получить обобщения фактов, хранящихся в БД. В процессе индуктивного обучения может участвовать специалист, поставляющий гипотезы. Такой способ называют обучением с учителем. Поиск правил обобщения может осуществляться без учителя путем автоматической генерации гипотез. В современных программных средствах, как правило, сочетаются оба способа, а для проверки гипотез используются статистические методы. Примером системы с применением индуктивных выводов является XpertRule Miner, разработанная фирмой Attar Software Ltd. (Великобритания);

6. Рассуждения на основе аналогичных случаев (метод "ближайшего соседа") (Case-based reasoning - CBR) основаны на поиске в БД ситуаций, описания которых сходны по ряду признаков с заданной ситуацией.

7. Принцип аналогии позволяет предполагать, что результаты похожих ситуаций также будут близки между собой. Недостаток этого подхода заключается в том, что здесь не создается каких-либо моделей или правил, обобщающих предыдущий опыт. Кроме того, надежность выводимых результатов зависит от полноты описания ситуаций, как и в процессах индуктивного вывода. Примерами систем, использующих CBR, являются: KATETools (Acknosoft, Франция), PatternRecognitionWorkbench (Unica, США);

8. Деревья решений - метод структурирования задачи в виде древовидного графа, вершины которого соответствуют продукционным правилам, позволяющим классифицировать данные или осуществлять анализ последствий решений. Этот метод дает наглядное представление о системе классифицирующих правил, если их не очень много. Простые задачи решаются с помощью этого метода гораздо быстрее, чем с использованием нейронных сетей. Для сложных проблем и для некоторых типов данных деревья решений могут оказаться неприемлемыми. Кроме того, для этого метода характерна проблема значимости. Одним из последствий иерархической кластеризации данных является отсутствие большого числа обучающих примеров для многих частных случаев, в связи с чем классификацию нельзя считать надежной. Методы деревьев решений реализованы во многих программных средствах, а именно: С5.0 (RuleQuest, Австралия), Clementine (IntegralSolutions, Великобритания), SIPINA (UniversityofLyon, Франция), IDIS (InformationDiscovery, США);

9. Эволюционное программирование - поиск и генерация алгоритма, выражающего взаимозависимость данных, на основании изначально заданного алгоритма, модифицируемого в процессе поиска; иногда поиск взаимозависимостей осуществляется среди каких-либо определенных видов функций (например, полиномов);

10. Алгоритмы ограниченного перебора, вычисляющие частоты комбинаций простых логических событий в подгруппах данных.

5. Интеграция OLAP и Data Mining

Оперативная аналитическая обработка (OLAP) и интеллектуальный анализ данных (Data Mining) - две составные части процесса поддержки принятия решений. Однако сегодня большинство систем OLAP заостряет внимание только на обеспечении доступа к многомерным данным, а большинство средств Data Mining, работающих в сфере закономерностей, имеют дело с одномерными перспективами данных. Для увеличения эффективности обработки данных для систем поддержки принятия решений эти два вида анализа должны быть объединены [2].

В настоящее время появляется составной термин "OLAP Data Mining" (многомерный интеллектуальный анализ) для обозначения такого объединения. Существует три основных способа формирования "OLAP Data Mining":

1. "Cubing then mining". Возможность выполнения интеллектуального анализа должна обеспечиваться над любым результатом запроса к многомерному концептуальному представлению, то есть над любым фрагментом любой проекции гиперкуба показателей.

2. "Mining then cubing". Подобно данным, извлечённым из хранилища, результаты интеллектуального анализа должны представляться в гиперкубической форме для последующего многомерного анализа.

3. "Cubing while mining". Этот гибкий способ интеграции позволяет автоматически активизировать однотипные механизмы интеллектуальной обработки над результатом каждого шага многомерного анализа (перехода между уровнями обобщения, извлечения нового фрагмента гиперкуба и т.д.).

Заключение

В данной курсовой работе была предоставлена заявленная во введении ознакомительная информация о корпоративных базах данных. Для раскрытия темы были введены понятия данных, базы данных, системы управления базами данных, корпоративные информационные системы. Кратко о выше перечисленном:

Базы данных представляют собой синтез структур данных и файловых структур.

Система управления базами данных (СУБД) - комплекс программ, которые обеспечивают взаимодействие пользователя с базой данных.

Корпоративная информационная система (КИС) - это масштабируемая система, предназначенная для комплексной автоматизации всех видов хозяйственной деятельности больших и средних предприятий, в том числе корпораций, состоящих из группы компаний, требующих единого управления.

Далее были рассмотрены корпоративные базы данных: OLTP-системы, главной задачей которых является выполнение большого количества коротких транзакций; хранилище данных - предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки управления; витрина данных (Data Mart) - облегченный вариант хранилища данных, содержащий только тематически объединенные данные; OLAP - многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий; интеллектуальный анализ данных (Data Mining). Были рассмотрены их особенности, положительные и отрицательные черты, а так же возможности интегрирования данных систем.

Использование подобного рода вспомогательных средств века компьютерных технологий важно для получения максимальных результатов при минимальных затратах в анализе, сборе и хранении информации. Как было сказано "Кто владеет информацией, тот владеет миром", а кто умеет грамотно воспользоваться информацией - владеет Вселенной возможностей.

С точки зрения экономики использование корпоративных баз данных для ведения бизнеса - необходимость в наше время. Неоспорима ценность скорости и качества обработки данных при использовании этих систем.

Список использованных источников

1. Андрейчиков А.В. Интеллектуальные информационные системы /А.В. Андрейчиков, О.В. Андрейчикова. - М.: Финансы и статистика, 2004.

2. Борисов Д.Н. Корпоративные информационные системы. - Воронеж: Издательско-полиграфический центр Воронежского государственного университета, 2007.

3. Запечников С.В. Основы построения частных сетей / С.В. Запечников, Н.Г. Милославская, А.И. Толстой. - М.: Горячая линия - Телеком, 2003.

4. Лукьянов Д.Б. Информатика и математика. Курс лекций. /Д.Б. Лукьянов.А.Н. Прокопенко. - Белгород ООНИ и РИД БелЮИ МВД России, 2004.

5. Рындин А.А. и др.; под ред.А. А. Рындина. Проектирование корпоративных информационных систем - Воронеж: Кварта, 2003.

6. Столингс В. Современные компьютерные сети / В. Столингс. - 2-е изд. - СПб.: Питер, 2003.

7. Хансен Г. "Базы данных" - Москва: БИНОМ, 2009