2.1 Основні проблемні середовища штучного інтелекту
Виділимо декілька типів проблемних середовищ, що найбільш часто зустрічаються.
Тип 1. Статичне проблемне середовище: статична предметна область; сутності представляються як сукупність атрибутів і їхніх значень; склад сутностей незмінний; БЗ не структуровані; вирішуються статичні задачі аналізу, використовуються тільки спеціалізовані що виконуються твердження.
Тип 2. Статичне проблемне середовище: статична предметна область; сутності представляються у виді атрибутів із значеннями або вироджених об'єктами (фреймів); склад сутностей незмінний; ієрархія БЗ або відсутня, або слабко виражена (нема спадкування властивостей); вирішуються статичні задачі аналізу, використовуються спеціалізовані твердження, що виконуються.
Тип 3. Статичне проблемне середовище: статична предметна область; сутності представляються у виді об'єктів; склад сутностей змінюваний; БЗ структуровані; вирішуються статичні задачі аналізу і синтезу, використовуються загальні і спеціалізовані що виконуються твердження.
Тип 4. Динамічне проблемне середовище: динамічна предметна область; сутності представляються сукупністю атрибутів і їхніх значень; склад сутностей незмінний; БЗ не структуровані; вирішуються динамічні задачі аналізу, використовуються спеціалізовані твердження, що виконуються.
Тип 5. Динамічне проблемне середовище: динамічна предметна область; сутності представляються у виді об'єктів; змінюваний склад сутностей; БЗ структуровані; вирішуються динамічні задачі аналізу і синтезу; використовуються загальні і спеціалізовані що виконуються твердження.
2.2 Проблема винятків
З успадкуванням пов’язана дуже серйозна проблема – проблема винятків. Вона полягає в тому, що деякі підкласи можуть не успадковувати ті чи інші властивості надкласів. Інакше кажучи, характерні риси класу успадковуються всіма його підкласами, крім деяких.
Нехай відомо, що літають всі птахи, крім пінгвінів (існують деякі інші види птахів, які не літають. Але для наших цілей це не має суттєвого значення). Якби це твердження відразу потрапило до бази знань саме в такому вигляді, особливих проблем не виникало б (хоча і в цьому випадку треба було б передбачити належну обробку винятків).
Але, як було зазначено раніше, експерт не завжди може сформулювати свої знання в явному вигляді. Зокрема, він може не знати або не пам”ятати всіх винятків. Тому він може спочатку включати до бази знань твердження про те, що всі птахи літають, а потім пригадати, що пінгвіни не літають, і додати це до бази знань.
У результаті ми могли б отримати базу знань, подібну до такої:
Рис. 1. Ілюстрація наслідування та обробки виключень
Усі птахи літають.
Ластівка є птахом.
Юкко є ластівкою.
Пінгвін є птахом.
Пінгвіни не літають.
Бакс є пінгвіном.
Якби три останні твердження не були включені до бази знань, система просто дійшла б хибного висновку, що Бакс літає. Але включення даних відомостей до бази знань ще більше ускладнює ситуацію. Система знань стає суперечливою: зодного боку, система повинна дійти висновку, що Бакс літає, а з іншого – що Бакс не літає. У даному випадку кажуть про втрату монотонності дедуктивної системи.
Система дедуктивного виведення називається монотонною, якщо виконується така властивість: якщо з набору тверджень (q1,…, qn) випливає твердження v , то v випливає і з набору тверджень (q1,…., qn, r).
Інакше кажучи, в монотонній теорії додавання нових фактів і правил не повинно впливати на істинність висновків, які могли бути отримані без них.
Додавання ж винятків до наявної бази знань може порушити монотонність. Існує багато підходів до вирішення цієї проблеми. Розробляються спеціальні немонотонні логіки : Рейтера, Мак-Дермотта та інші. Проте існують досить прості практичні прийоми. Наприклад, список виключень можна підтримувати явним чином. Інший корисний сформульований прийом : у разі виникнення суперечностей підклас успадковує відповідну властивість лише від найблищого попередника, тобто від класу, найближчого до нього в ієрархії класів.
Далі буде показано, як проблема винятків може вирішуватись в рамках продукційних систем і семантичних мереж.
У семантичних мережах можна також вводити зв’язки, що задають імплікацію, явно.
Слід відмітити, що формалізм семантичних мереж є зручним для задання знань і не дуже зручним для формалізації логічного виведення. Деякі конкретні методи логічного виведення на семантичних мережах описані в [Иск.интел, Вагин, Предст. зн]. Багато з них спираються на механізми дедуктивного виведення, характерні для логічних моделей та продукційних систем (в першу чергу - метод резолюцій). Ряд методик використовує співставлення зі зразком; таке співставлення є більш характерним для фреймових моделей. Але існують і методики, специфічні для семантичних мереж як графових моделей. В основі цих методик лежитьінтерпретація логічного виведення та пошуку потрібної інформації в базі знань, яка задана семантичною мережею,як пошуку на графі. Зокрема, в [Предст.зн.] коротко описаний спосіб виведення, який називається перехресним пошуком. Відповідь на запитання формується на основі знаходження та аналізу шляхів між об’єктами, які фігурують у запитанні.
Наприклад, при аналізі мережі, зображеної на рис. 1, на запитання “Що спільного між Баксом та Юкко?” система може відповісти “Обидва вони птахи, але різних видів”.
2.3 Проблема неточних і неповних знань
Раніше ми розглядали проблеми, які необхідно було вирішувати при проектуванні та розробці баз знань. Серед інших проблем можна відмітити такі.Знання можуть бути неповними. Це означає, що для доведення або спростування певного твердження може не вистачати інформації. У багатьох системах логічного виведення прийнято постулат замкненості світу. Це означає, що на запит про істинність деякого твердження система відповідає „так” тоді і тільки тоді, коли його можна довести; якщо ж довести це твердження неможливо, система відповідає „ні”. Водночас „неможливо довести через нестачу інформації” і „доведено, що ні” - це зовсім не одне й те саме. З огляду на це бажано, щоб експертна система запитувала у користувача про факти, яких не вистачає.
Знання можуть бути недостовірними. Наприклад, на результат виконання продукції можуть впливати випадкові чинники (об”єктивна невизначенність) або ж експерт може бути не зовсім впевненим у деякому факті чи правилі виведення (суб”єктивна невизначенність).
Ненадійність знань і недостовірність наявних фактів обов”язково повинні враховуватися в процесі логічних побудов. Звичайно, можна було б просто відкидати факти та првила виведення, які викликають сумнів, але тоді довелося б відмовитися від цінної інформації. Тому необхідно розвивати процедури, які дозволяють здійснювати логічні побудови при недостовірних даних, і використовувати ці процедури в експертних системах. Необхідно враховувати модальність, а саме: необхідність або можливість того чи іншого факту, ставлення суб”єкта до деякого твердження і т.п. Крім того, в таких системах часто доводиться мати справу з неточно визначеними, нечіткими поняттями, такими, як „великий”, „маленький” тощо.
2.4 Деякі проблеми виведення
Нехай ми маємопродукційне правило А=>В (якщо А, то В), при цьому коефіціент упевненості цього правила дорівнює (y). Зпогляду теорії ймовірностей цей коефіцент упевненості можна проінтерпретувати як Р(В\А) – умовну ймовірність В за умови А.
Нехай коефіціент упевненості твердження А дорівнює (а). Тут ми розглядаємо коефіціенти упевненості окремих тверджень як їх ймовірності.
Чому (в) дорівнює = Р(В) – коефіціент упевненості висновку В? Зразу ж необхідно сказати, що ми не можемо обчислити Р(В) точно – для цього не вистачає інформації. Натомість ми можемо обчислити інтервал, до якого потрапить ця ймовірність.
Очевидно, події А та А складають повну групу подій. Тоді відповідно до формули повної ймовірності маємо:
в=Р(В)=Р(А)Р(В\А)+Р(А)Р(В\А)=ау+(1-а)*Р(В\А).
У цій формулі фігурує невідоме значення Р(В\А), і саме тому точне обчислення (в) не є можливим. Але, оскільки 0=<P(B\A)=<1, маємо
ау=<Р(В) =<ау+(1-а),
в Є[ay, ay+(1-a)].
Отже, інтервал невизначенності для висновку В є тим меншим, чим юільшим є коефіціент упевненості умови А. Якщо а=1, (в) визначається точно.
Якщо ж а=0, інтервал невизначенності для (в) становить [0,1], а це еквівалентно повній відсутності будь-якої корисної інформації.
Ми бачимо, що навіть у найпростіших випадках пряме застосування теоретико-ймовірнісних співвідношень спричиняє проблеми. Ситуація ще більше ускладнюється, якщо невизначеність носить „суб”єктивний” характер. Тому необхідно мати наближені, але простіші методики обчислення коефіціентів упевненості, які у більшості випадків давали б прийнятний результат.
3.1Деякі інтелектуальні задачі
Розглянемо і проаналізуємо в загальних рисах деякі проблеми, які доводиться постійно вирішувати людському розумові: розпізнавання образів, мислення та обчислювальні задачі.
На інтуїтивному рівні можна сформулювати декілька типових задач розпізнаванняобразів (або просто розпізнавання):
n задачаідентифікації [1] полягає в тому, що об’єкт, якийспостерігається людиною, потрібно вирізнити серед інших (наприклад, побачивши іншу людину, впізнати у ній свою дружину);