Введение
За последние тридцать лет теория баз данных (БД) стала одним из основных
разделовинформатики, оказывающим сильное воздействие на развитие архитектуры
вычислительных систем, современную информационную технологию и
методологиюпроектирования автоматизированных информационных систем (АИС),
особенно банков данных (БнД). В последние годы в теории БД сложилось новое
направление научныхисследований, получившее название семантического, или
концептуального, моделирования в БД. Его основная цель - интеллектуализация
банков данныхи организация интерфейса конечного пользователя с информационной
системой на уровне представлений о предметной области, а не на уровне структур
данных.
Первоначально в теории БД основное внимание уделялось средствам эффективной
организацииданных и манипулирования ими. Так возникли получившие всеобщее
распространение три "великих", по выражению Дж. Ульмана, модели
данных:иерархическая, реляционная и сетевая. Одновременно стало ясным, что
эффективность новых информационных систем - банков данных - зависит не толькоот
характеристик технических средств и программного обеспечения, но и от
эффективности взаимодействия человек - машина. Перенос акцента на
конечногопользователя и привел в конечном счете к формированию нового
направления исследований в теории БД, непосредственно связанного с задачей о
представлениизнаний.
В настоящее время определился основной подход к решению задач семантического
моделированияв базах данных. Он заключается в выделении двух уровней
моделирования: уровня концептуального моделирования ПО (предметной области) и
уровня моделированиясобственно базы данных. На верхнем уровне осуществляется
переход от неформализованного описания ПО и информационных потребностей
конечногопользователя к их формальному выражению с помощью специальных языковых
средств. Обсуждению возможных конструкций концептуальной модели ПО
посвящентеоретический раздел данного курсового проекта.
Формулировка цели КП
Целью данного курсового проекта является разработка теоретического и
практического материаладля обеспечения доступного изучения соответствующих
разделов по дисциплине Инженерия Знаний, а именно: представления знаний об
объектах, представлении ииспользовании знаний об отношении между объектами, а
также организации обобщенной информации на основе использования
мультииерархическойтаксономической структуры. Практические разработки данного КП
(структуры баз данных в СУБД Microsoft Access 2.0, а также приведенная методика
создания этих структур в Access2.0) могут являться материалом для выполнения
лабораторных работ по дисциплине Инженерия Знаний при условии наличия
необходимых технических средств.
1. Теоретический раздел
Инженерия знаний - область информатики, в которой исследуются методы
представлениязнаний, манипулирования ими и поддержания их в актуальном
состоянии.
Информационная система - организованная совокупность технических и
обеспечивающих средств,технологических процессов и кадров, реализующих следующие
основные функции:
-сбор информации;
-хранение информации;
-поиск и обработка информации;
-передача информации;
Модель ПО
(понятийное знание)
Система управления
базами знаний
Пакеты
База данных
прикладных
программ
(процедурные
знания)
Предметное знание
рис.1
Краеугольным камнем исследований последнего времени является понятие
"предметнаяобласть банка данных" (ПО) (enterprise, universe of discourse).
Совокупность объектов, о которых можно задавать вопросы, образует объектное ядро
предметнойобласти. Здесь слово "объект" употреблено как синоним слова "реалия";
не предполагается, что объекты обязательно имеютматериальную, "вещную" природу.
Термин "объект" также является первичным, неопределяемым понятием. (См. рис.2а)
Синонимами, помимоупотребленного выше слова "реалия", служат слова "сущность"
(entity), "вещь" (thing). Примеры объектов - отдельный студент, группастудентов,
аудитория, время занятий, слова, числа и т.д. Обычно считается, что быть
объектом - значит быть дискретным и различимым. По - видимому,
примеры"необъектов" - это мир, время, материя, смысл и т.п., хотя можно
представить ИС, в которой хранятся сведения об этих категориях.
Объект
Предмет
первичное
неопределяемое
модель объекта
понятие
в качестве объектов
могут быть
абстракция
не только физические,
но и объекты
мышления
рис. 2а
рис.2б
Часто слово "объект" считается близким по смыслу слову "предмет".Однако
представляется удобным слово "предмет" использовать в том случае, когда объект,
существующий вне нас, становится носителем определеннойсовокупности свойств и
входит в различные взаимоотношения, которые представляют интерес для
потребителей информации, хранящейся в АИС. Другими словами, предмет- это объект,
ставший объектом рассмотрения, наблюдения, ставший носителем определенных
свойств. Один и тот же объект воспринимается разными системами какразные
предметы. Предмет является результатом абстракции реального объекта, результатом
огрубления действительности, при котором игнорируется бесконечноемногообразие
свойств и взаимодействий объекта. Таким образом, предмет - это модель реального
объекта: если объект имеет онтологический статус, то предмет -гносеологический.
(См. рис.2б)
Объекты могут быть простыми и сложными. Простыми называются объекты, которые для
даннойпредметной области считаются бесструктурными. Простые объекты
представляются совокупностью характеризующих их свойств. Внутренняя структура
простого объектане раскрывается.
Сложные объекты имеют определенный состав и структуру. Например:
Студент Иванов учится в группе АИ-2-93
Способы идентификации объектов:
1. Прямая идентификация. Основана на использовании имен объектов.
2. Косвенная идентификация. Основана на указании свойств объекта. В БД
косвеннаяидентификация основывается на использовании ключей.
Ключ - набор полей записи, значения которых однозначно определяют запись файла.
В конкретный момент времени состояние предметной области определяется
совокупностью объектови ситуаций, имеющих место в данный момент времени.
Пространство состояний предметной области - это класс всех возможных конечных
множествобъектной и системной предметной области.
Для описания динамики предметной области нужно рассмотреть траекторию предметной
области впространстве состояний.
Семантика предметной области определяется как общее свойство всех возможных
траекторий впространстве состояний.
На рис.3 предложена классификация ситуаций. Эта классификация рассматривает
свойства какспециальный случай ситуаций. Одновременно она вводит еще одно важное
понятие - понятие времени, которое явно или неявно присутствует при выделении
подклассовуказанной иерархии. Время выступает как множество отдельных моментов и
как множество интервалов (временное состояние, негомогенный процесс). В явном
видеструктуры этих множеств не фиксированы, хотя отношение следования между
моментами времени считается известным.
Следует различать реальное время внешнего мира и его отражение в ИС и в
источникахинформации. Внутри системы зависящие от времени взаимосвязи
фокусируются только после их регистрации источниками и передачи сообщений
информационной системе.
Другое понятие, также неявно участвующее в указанной классификации, - это
понятие пространства."Постоянными являются все свойства и соотношения,
вытекающие из принадлежности объектов к той или инойтаксономической
категории..., свойства типов объектов, а также отношения кровного родства,
неотъемлемой принадлежности, относительное расположениенеподвижных предметов
..., свойства и отношения абстрактных объектов, не локализованные в
пространстве". Вприведенном высказывании хочется обратить внимание еще на два
обстоятельства: для лингвиста несомненно наличие таксономических категорий
объектов, которыеобладают собственными свойствами, и наличие общих свойств у
объектов одной таксономической категории. Эти само собой разумеющиеся
обстоятельства широкоиспользуются в семантических моделях баз данных.
ситуации
статические
динамические
состояния постоянные процессы
события
свойства и
отношения
устойчивые временные результаты
происшествия
рис.3
Ситуации сами являются объектами, поэтому могут обладать различными свойствами.
Введя пространство состояний, можно рассматривать в нем определенные
траекторииили последовательности состояний g0, g1, ..., gt,... , в которых
находится ПО в моменты времени 0, 1, ..., t, ... Члены такой последовательности
не могут быть совершенно произвольными, поскольку состояние gtобычно как - то
связано с предшествующими состояниями g0, g1,..., gt-1. Поэтому предметную
область можно определить как класс всех действительновозможных
последовательностей состояний. Такие последовательности называются
траекториямиПО. Совокупность всех общих свойств траекторий называется семантикой
предметной области.
Итог проведенных рассмотрений подведем следующей диаграммой,
классифицирующейобъекты в предметной области и дополняющей рис.3.
Объекты ПО
материальные нематериальные
имена понятия
ситуации
рис.4
Концептуальные средства описания предметной области
Эти средства обладают абстрактностью и универсальностью. В силу своей
абстрактности средстваописания стали называться концептуальными.