Смекни!
smekni.com

Модели знаний и данных (стр. 2 из 3)

В основе моделей этого типа лежит конструкция, названная семантической сетью. Сетевые модели формально можно задать в виде Н=[I,C1,C2,..,CN,G]. Здесь I множество информационных единиц; С1,..,СN – множество типов связей между информационными единицами. Отображение G задает между информационными единицами, входящими в I связи из заданного набора типов связей.

В зависимости от типов связей, используемых в модели, различают классифицирующие сети, функциональные сети и сценарии.

Пример: Рассмотрим набор из нескольких фраз.

Попугай Кеша является птицей, и он умеет говорить.


Зовут является


умеет

Фреймовые и сетевые модели.

Ранее были рассмотрены семантические сети. Понятия, входящие в сеть, описываются в виде фреймов. А что такое фрейм?

Фрейм – это минимально возможное описание сущности какого-либо события, ситуации, процесса или объекта. Существует и другое понимание фрейма – это ассоциативный список атрибутов. Понятие минимально возможное означает, что при дальнейшем упрощении описания теряется его полнота, и оно перестает определять ту единицу знаний, для которой было предназначено. Представление знаний с помощью фреймов понимается как один из способов представления знаний о ситуациях. Фрейм имеет имя (название) и состоит из слотов. Слоты – это незаполненные (нулевые) позиции фрейма. Если у фрейма все слоты заполнены – это описание конкретной ситуации. В переводе с английского слово «фрейм» означает «рамка», а слово «слот» – «щель». В отличие от моделей других типов во фреймовых моделях фиксируется жесткая структура информационных единиц, которая называется протофреймом. В общем виде структура информационных единиц выглядит следующим образом:

(Имя фрейма:

имя слота1 (значение слота1);

имя слота2 (значение слота2);

. . . . . . . . . . . . . . . . . . . . . . . . . .

имя слотаК (значение слотаК)).

Значением слота может быть практически что угодно (числа, математические соотношения, тексты на естественном языке или на языке программ, ссылки на другие слоты данного фрейма).Значением слота может выступать и отдельный фрейм, что является очень удобным для упорядочивания знаний по степени общности. Исключение из фрейма любого слота делает его неполным, а иногда и бессмысленным.

При конкретизации фрейма ему и слотам приписываются конкретные имена и происходит заполнение слотов. Таким образом из протофреймов получаются фреймы – экземпляры. Переход от исходного протофрейма к фрейму – экземпляру может быть многошаговым, за счет постепенного уточнения значений слотов.

Рассмотрим некоторый протофрейм:

(Список сотрудников:

Фамилия (значение слота1);

Год рождения (значение слота2);

Специальность (значение слота3);

Стаж (значение слота4)).

Если в качестве значений слотов использовать конкретные данные, то получим фрейм – экземпляр:

(Список сотрудников:

Фамилия (Попов – Сидоров – Иванов – Петров);

Год рождения (1965 – 1975 – 1980 – 1978);

Специальность (директор – бухгалтер – техник – курьер);

Стаж (15 – 7 – 3 – 4)).

Связи между фреймами задаются значениями специального слота с именем «связь». Как я уже ранее писал часть специалистов по ИС считает, что нет необходимости специально выделять фреймовые в представлении знаний, так как в них объединены все основные особенности остальных типов.

Теперь рассмотрим несколько примеров:

1. Пусть дана некоторая фраза «Кассир выдает деньги рабочим». Запишем её в виде фрейма:

(Выдает:

служащий (кассир);

получатель (рабочий);

объект (деньги)).

Из примера видно что фрейм имеет следующую протоструктуру

(Выдает:

служащий (Значение слота1);

получатель (Значение слота2);

объект (Значение слота3)).

№2. Пусть дан некоторый фрейм. Сформулируем на естественном языке те знания которые заложены в этом фрейме.

(Список учеников:

Фамилия (Иванов – Петров – Сидоров);

Год рождения (1987 – 1985 – 1990);

Класс (5 – 7 – 2)).

1. Иванов родился в 1987 и учится в 5-м классе.

2. Петров родился в1985 и учится в 7-м классе.

3. Сидоров родился в 1990 и учится во 2-м классе.

Еще рассмотрим пример вложенного фрейма т.е.

(План недели:

мероприятие1 (Собрание);

мероприятие2 (Празднование);

мероприятие3 (Футбольный матч)).

(Собрание:

Тема (Начало учебного года);

Время (Понедельник, 14.00);

Место (Актовый зал);

Присутствуют (Коллектив школы)).

(Празднование:

Тема (День рождения);

Время (Среда, 17.00);

Место (Столовая);

Присутствуют (Ученики класса)).

(Футбольный матч:

Тема (болеть за «наших»);

Время (Пятница, 18.30);

Место (Стадион);

Присутствуют (болельщики команд)).

Для сетевых моделей стоит выделить следующие проблемы:

1.Сетевые модели не имеют общей теории.

2.Много эвристики.

3.Проблема эффективности процедур работы с сетями.

4.Много видов сетей, в том числе рассчитанных на аппаратную реализацию.

ПРЕДСТАВЛЕНИЕ ЗНАНИЙ В СИСТЕМЕ РАСПРЕДЕЛЕННЫХ БАЗ ЗНАНИЙ И ДАННЫХ В INTERNET / INTRANET.

Постановка задачи.

В настоящее время в основном три изобретения в области информатики определяют пути ее развития;

экспертные системы,

системы управления базами данных,

сеть Internet.

В последние два десятилетия широкое распространение в различных областях деятельности получили экспертные системы. Отличительной чертой компьютерных программ, называемых экспертными системами, является их способность накапливать знания и опыт высоко квалифицированных специалистов в какой-либо узкой предметной области. Затем с помощью этих знаний пользователи экспертных систем, имеющие не очень высокую квалификацию, могут решать свои текущие задачи столь же успешно, как это сделали бы сами эксперты. На данный момент экспертные системы должны удовлетворять следующим требованиям :

1.Необходимо использовать в них не поверхностные знания в виде эвристических правил, а глубинные, представляющие собой теории предметных областей и общие стратегии решения проблем.

2.Знания должны быть организованы в виде составных иерархических представлений, включающих сети фреймов, продукции и логические модели.

3.Экспертная система должна решать задачи из динамических предметных областей, то есть областей, знания о которых могут изменяться непосредственно в процессе вывода.

4.Одним из компонентов экспертной системы должна являться база данных с неполной информацией.

5.Система должна быть способна анализировать имеющиеся у нее знания, обнаруживая противоречия между старыми знаниями и вновь полученными от эксперта, устанавливать факт их неполноты или ошибочности.

В большинстве случаев современные экспертные системы не удовлетворяют этим требованиям. Следует сказать о таком важном, недостатке экспертных систем, как отсутствие возможности хранить большие объемы данных. Конечно, в принципе база знаний экспертной системы может хранить любое количество данных в виде правил-продукций или просто фактов. Но механизм ее работы в общем виде таков, что при работе с большими объемами похожих фактов или правил скорость работы резко падает.

Остановимся теперь на средствах управления базами данных. Не секрет, что в связи с ростом объемов носителей и скоростей передачи данных человечество просто тонет в огромном количестве информации. Все знания, которыми когда-либо обладал человек если уже не хранятся, то в ближайшем будущем будут храниться в компьютеризированном виде. Таким образом, если человеку нужна какая-либо конкретная информация, он может быть уверен, что где-то, на каком-то сервере и в какой-то базе данных эта информация уже хранится. Нужно только извлечь ее. Дальше начинаются сложности. Пользователь должен знать не только точный адрес нужного сервера, но и представлять себе, где именно на этом сервере и в каком виде хранится нужная ему информация. И это еще не все. Человек должен суметь сформулировать свой вопрос на языке, прямо скажем, далеком от естественного, например, на языке SQL. Только тогда он сможет добраться до нужной информации.

Примерно тем же недостатком обладают средства поиска информации в сети Internet. Поисковые машины Internet ни в коей мере не используют семантику предметной области при поиске информации, а могут искать информацию только по ключевым словам, подбор которых является для пользователя отнюдь не тривиальной задачей. Кроме того, даже зная какие слова нужно искать, пользователь не гарантирует себе успешный поиск, т.к. не знает в каком падеже используются эти слова.

Итак: Экспертная система способна выдавать ответы, выбирая их из собственной базы знаний или выводя с помощью правил-продукций, но не имеет доступ к огромным массивам информации, хранящимся в базах данных различного типа.

Средства управления базами данных, например, SQL-сервера, способны выдавать только конкретную информацию по конкретным запросам, сформулированным на соответствующем языке. Делать выводы и самообучаться они не могут.

Средства поиска информации в Internet не способны гарантировать успех, т.к. не используют при поиске семантику предметной области.

Таким образом, мы пришли к выводу, что ни базы знаний с инструментарием экспертной системы, ни базы данных с языками запросов, ни поисковые машины Internet неискушенного человека удовлетворить не могут. Тогда и возникла идея объединить базы данных и базы знаний едиными концепциями и единым инструментарием и погрузить их в среду Internet / Intranet .