Аналіз за допомогою відмінкових фреймів. Із створенням відмінкових фреймівпов'язанийвеликийстрибок у розвитку NLP. Вони набули популярності після роботи Филлмора “Справа про відмінок”. На сьогоднішній день відмінкові фрейми - один з найбільш часто використовуваних методів NLP, тому що він є найбільше комп'ютерним-ефективним при аналізі як знизу-нагору (від складових до цілого), так і зверху- униз (від цілого до складових).
Відмінковий фрейм складається з заголовка і набору ролей (відмінків), пов'язаних певним чином із заголовком. Фрейм для комп'ютерного аналізу відрізняється від звичайногофрейма тим, що відношення між заголовком і ролями визначається семантично, а не синтаксично, тому що в принципі одному і тому слову можуть приписуватися різні ролі, наприклад, іменник може бути як інструментом дії, так і його об'єктом.
Загальна структура фрейму наступна:
[Заголовне дієслово
[відмінковий фрейм агент: <активний агент, що чинить дію> об'єкт: <об'єкт, над яким відбувається дія>
інструмент: <інструмент, використовуваний при вчиненні дії>
реціпієнт: <одержувач дії - часто непряме доповнення>
напрямок: <ціль (звичайно фізичного) дії>
місце: <місце, де відбувається дія>
бенефіціант: <сутність, в інтересах якої відбувається дія>
коагент: <другий агент, що допомагає чинити дію>
]]
Наприклад, для фрази Іван дав м'яч Каті відмінковий фрейм виглядає так:
[Давати
[відмінковий фрейм агент: Іван об'єкт: м'яч
реціпиієнт: Катаючи]
[грам
час: минулий
застава: акт]
]
Існують обов'язкові, необов'язкові і заборонені відмінки. Так, для дієслова розбити обов'язковим буде відмінок об'єкт - без нього висловлення буде незакінченим. Місце і коагент будуть у даному випадку необов'язковими відмінками, а напрямок і реціпієнт - забороненими.
Часто в NLP буває корисним використовувати семантичне уявлення у як можна більш канонічній формі. Найбільш відомим засобом такої репрезентації є метод концептуальних залежностей, розробленийШенком для дієслів дії. Він полягає в тому, що кожна дія подана у вигляді однієї або більш простіших дій.
Наприклад, для речення Іван дав м'яч Каті (1) і Катя взяла м'яч в Івана (2), що різнятьсясинтаксично, але обидва, щоозначають акт передачі, можуть бути побудованітакі репрезентації з використанням найпростішої дії Atrans, що застосовується в граматиці концептуальних залежностей:
(1) | (2) |
[Atrans | [Atrans |
Відн: володіння | Відн: володіння |
Агент: Іван | Агент: Катя |
об'єкт: м'яч | об'єкт: м'яч |
Джерело: Іван | Джерело: Іван |
реціпієнт: Катя] | Реціпієнт: Катя] |
За допомогою такого уявлення легко виявляються подібності і розбіжності фраз.
Для полегшення аналізу також використовується розподіл ролі на лексичний маркер і заповнювач. Так, для ролі об'єкт може бути встановлений маркер пряме доповнення, для ролі джерело - маркер виду <маркер-із>=із|від|...
Загалом аналіз тексту за допомогою відмінкових фреймів складається з таких кроків:
·Використовуючи існуючі фрейми, підібрати сумісний із заголовком. Якщо такого немає, текст не може бути проаналізований.
·Повернути в систему потрібний фрейм із відповідним заголовком-дієсловом.
·Спробувати провести аналіз по всіх обов'язкових відмінках. Якщо один або більш обов'язкових заповнювачіввідмінків не знайдені, то повернути в систему код помилки. Такий випадок може означати наявність еліпсиса, зрадливий вибір фрейма, невірно введений текст або хибаграматики. Такі кроки використовуються вже для аналізу і виправлення таких ситуацій.
·Провести аналіз по всіх необов'язкових відмінках.
·Якщо після цього у введеному тексті залишилися непроаналізовані елементи, видати повідомлення про помилку, пов'язану з невірним вводом, недостатністю даного аналізу або необхідністю провестиінший, більш гнучкий аналіз.
·Переваги використання відмінкових фреймов такі: суміщення двох стратегій аналізу (поверх униз і знизу нагору); комбінування синтаксису і семантики;
·зручність при використанні модульних програм.
Певнускладність при аналізі являє варіативність того самого запиту. Наприклад, на вхід системи, що управляє зарахуванням і перерозподілом учнівських на курсах різних фахів, може надійти запит типу Перевідіть Петрова, якщо це можливо, із математики на, скажімо, економіку.
Найбільш легко такі складностідолаються при використанні відмінкових фреймів. Правило, сформульованеКарбонеллом і Хейзом, говорить: “Варто пропускати невідомі введені елементи доти, поки не буде знайдений відмінковий маркер; пропущені елементи варто аналізувати з урахуванням незаповнених відмінків, використовуючи тільки семантику”.
Діалог
Поряд із проблемою розпізнавання тексту існує і проблема підтримки інтерактивного діалогу. При цьому виникають додаткові особливості, характерні для діалогів, як-от:
·анафора (тобто використання займенників замість їхній анафоричних антецедентів - самостійних частин мови);
·еліпсис;
·екстраграматичніречення (пропускання артиклів, помилки, вживання окликів і т.п.);
·металінгвістичніречення (тобто спроба виправлення введеного раніше).
Окрім того, користувачі систем із природно-мовним інтерфейсом намагаються вмсловлюватися як умога коротше, що в деяких випадках також ускладнює аналіз.
Використання відмінкових фреймів, як у разі злиття поточного фрейму з попереднім, забезпечує відновлення еліпсиса.
Експертні системи та їх архітектура.
Експертна система - це комп'ютерна програма, що моделює міркування людини-експерта у визначенійобласті, використовуючи для цього БЗ, що містить факти і правила про цю область і деяку процедуру логічного висновку.
РозробкаЕС - порівняно новий напрямок у системах ШІ; друганазва - інженерія знань (термін введено у 1977 Фегенбаум), сформувалася в середині 70 р.
Раніш існував ланцюг: аналітик - програміст - оператор - користувач; тепер користувач може звертатися безпосередньо до ЕОМ (або тільки через інженера по знаннях).
Структура ЕС:
раніш: вхідні даніпрограм | тепер:вхідні даніінтерпретатор БЗБЗ |
Звичайні програми мають фіксовану послідовність кроків, строго визначену програмістом, ЕС користуються знаходженням задовільного рішення методом спроб і помилок.
ЕС вирішують важко формализуємізадачі, які не мають алгоритмічного вирішення () медицина, геологія, керування, юридичні науки).
Що зумовило появу ЕС:
орієнтованість на вирішеннязадач у неформалызованихобластях
призначеність для користувачів, що не мають спецыаальних навичок програмування
ЕС вирішують задачы краще, ніж людина.
ЕС повинна мати спроможністьодержувати знання. Існує 2 джерела придбання знань:
1) від експерта
2) із текстів
ЕС вирішують практичні задачі, а не експериментальні; рішенняЕС можуть бути пояснені користувачу, тобто мають властивість прозорості, для цього існує спеціальний компонент - пояснювальний.
Формальна основа ЕС: базове поняття - правило продукції або формальні процедури системи: правила видуумова -> діяякщо -> те (якщо було розлито пальне - товикликайте пожежних).
Архітектура ЕС
Користувач ЕС Спілкування на ПМ | Лігвітсичний компонент аналізу із синтезу вхідних повідомлень | робоча пам'ять поточнийстан проведення експертизи | пояснювальний компонент |
інтерпретатор | |||
компонент придбання знань | |||
БЗ |
БЗ має динамічний характер, містить факти і правила у формі продукцій
інтерпретатор має справу з процедурами логічного висновка, на основі наявних даних вирішує задачу
лінгвістичний процесор здійснює діалог із користувачем
робоча пам'ять зберігає дані
компонент придбання знань - із його допомогою знання отримуються від експерта або тексту і заносяться до БЗ
пояснювальний компонент відповідає на запитання, чому прийняті nfrs рішення і чим мотивовано вибір.
Гіпертекст - це текст, значимі елементи якого можуть читатися в різній послідовності.
Послідовність читання - довільна. Між текстовими фрагментами визначено дозволені переходи. Як правило, від одного фрагмента можна перейти до декількох інших. Читати можна з будь-якого елемента у різних напрямках. Комп'ютери дозволяють миттєво переходити від одного фрагмента тексту до іншого, що дозволяє читати нелінійні так само легко, як лінійні.
Гіпертекст – комп’юторізований нелінійний текст. Нельсон і Энгельбарт вперше реалізували ГТ наприкінці 60 р.
Особливості ГТ у порівнянні з традиційними нелінійними текстами (текст із коментарями, посиланнями, енциклопедія):
1. явна виразність мережної структури: вузли (текстові фрагменти) і зв'язку (можливість переходу від одного ТФ до іншого -> навігація). Зв'язок може бути однонаправлений від фрагмента до коментарю або двонаправлений між двома фрагментами. Зв'язок може носити ієрархічний характер - від загального до цілого.
Інтерфейс користувача:
перехід - не більш двох клавіш
користувач повинен мати засоби орієнтації: При кожному вузлі дається зміст - локальна орієнтація. Глобальна орієнтація - наочне зображення структури гіпертекстовоїмережі, у якій позначається шлях, пройдений користувачем