Смекни!
smekni.com

Використання фреймів та семантичних мереж для обробки природньої мови (стр. 6 из 7)

Аналіз за допомогою відмінкових фреймів. Із створенням відмінкових фреймівпов'язанийвеликийстрибок у розвитку NLP. Вони набули популярності після роботи Филлмора “Справа про відмінок”. На сьогоднішній день відмінкові фрейми - один з найбільш часто використовуваних методів NLP, тому що він є найбільше комп'ютерним-ефективним при аналізі як знизу-нагору (від складових до цілого), так і зверху- униз (від цілого до складових).

Відмінковий фрейм складається з заголовка і набору ролей (відмінків), пов'язаних певним чином із заголовком. Фрейм для комп'ютерного аналізу відрізняється від звичайногофрейма тим, що відношення між заголовком і ролями визначається семантично, а не синтаксично, тому що в принципі одному і тому слову можуть приписуватися різні ролі, наприклад, іменник може бути як інструментом дії, так і його об'єктом.

Загальна структура фрейму наступна:

[Заголовне дієслово

[відмінковий фрейм агент: <активний агент, що чинить дію> об'єкт: <об'єкт, над яким відбувається дія>

інструмент: <інструмент, використовуваний при вчиненні дії>

реціпієнт: <одержувач дії - часто непряме доповнення>

напрямок: <ціль (звичайно фізичного) дії>

місце: <місце, де відбувається дія>

бенефіціант: <сутність, в інтересах якої відбувається дія>

коагент: <другий агент, що допомагає чинити дію>

]]

Наприклад, для фрази Іван дав м'яч Каті відмінковий фрейм виглядає так:

[Давати

[відмінковий фрейм агент: Іван об'єкт: м'яч

реціпиієнт: Катаючи]

[грам

час: минулий

застава: акт]

]

Існують обов'язкові, необов'язкові і заборонені відмінки. Так, для дієслова розбити обов'язковим буде відмінок об'єкт - без нього висловлення буде незакінченим. Місце і коагент будуть у даному випадку необов'язковими відмінками, а напрямок і реціпієнт - забороненими.

Часто в NLP буває корисним використовувати семантичне уявлення у як можна більш канонічній формі. Найбільш відомим засобом такої репрезентації є метод концептуальних залежностей, розробленийШенком для дієслів дії. Він полягає в тому, що кожна дія подана у вигляді однієї або більш простіших дій.

Наприклад, для речення Іван дав м'яч Каті (1) і Катя взяла м'яч в Івана (2), що різнятьсясинтаксично, але обидва, щоозначають акт передачі, можуть бути побудованітакі репрезентації з використанням найпростішої дії Atrans, що застосовується в граматиці концептуальних залежностей:




(1)
(2)
[Atrans [Atrans
Відн: володіння Відн: володіння
Агент: Іван Агент: Катя
об'єкт: м'яч об'єкт: м'яч
Джерело: Іван Джерело: Іван
реціпієнт: Катя] Реціпієнт: Катя]

За допомогою такого уявлення легко виявляються подібності і розбіжності фраз.

Для полегшення аналізу також використовується розподіл ролі на лексичний маркер і заповнювач. Так, для ролі об'єкт може бути встановлений маркер пряме доповнення, для ролі джерело - маркер виду <маркер-із>=із|від|...

Загалом аналіз тексту за допомогою відмінкових фреймів складається з таких кроків:

·Використовуючи існуючі фрейми, підібрати сумісний із заголовком. Якщо такого немає, текст не може бути проаналізований.

·Повернути в систему потрібний фрейм із відповідним заголовком-дієсловом.

·Спробувати провести аналіз по всіх обов'язкових відмінках. Якщо один або більш обов'язкових заповнювачіввідмінків не знайдені, то повернути в систему код помилки. Такий випадок може означати наявність еліпсиса, зрадливий вибір фрейма, невірно введений текст або хибаграматики. Такі кроки використовуються вже для аналізу і виправлення таких ситуацій.

·Провести аналіз по всіх необов'язкових відмінках.

·Якщо після цього у введеному тексті залишилися непроаналізовані елементи, видати повідомлення про помилку, пов'язану з невірним вводом, недостатністю даного аналізу або необхідністю провестиінший, більш гнучкий аналіз.

·Переваги використання відмінкових фреймов такі: суміщення двох стратегій аналізу (поверх униз і знизу нагору); комбінування синтаксису і семантики;

·зручність при використанні модульних програм.

Стійкість аналізу

Певнускладність при аналізі являє варіативність того самого запиту. Наприклад, на вхід системи, що управляє зарахуванням і перерозподілом учнівських на курсах різних фахів, може надійти запит типу Перевідіть Петрова, якщо це можливо, із математики на, скажімо, економіку.

Найбільш легко такі складностідолаються при використанні відмінкових фреймів. Правило, сформульованеКарбонеллом і Хейзом, говорить: “Варто пропускати невідомі введені елементи доти, поки не буде знайдений відмінковий маркер; пропущені елементи варто аналізувати з урахуванням незаповнених відмінків, використовуючи тільки семантику”.

Діалог

Поряд із проблемою розпізнавання тексту існує і проблема підтримки інтерактивного діалогу. При цьому виникають додаткові особливості, характерні для діалогів, як-от:

·анафора (тобто використання займенників замість їхній анафоричних антецедентів - самостійних частин мови);

·еліпсис;

·екстраграматичніречення (пропускання артиклів, помилки, вживання окликів і т.п.);

·металінгвістичніречення (тобто спроба виправлення введеного раніше).

Окрім того, користувачі систем із природно-мовним інтерфейсом намагаються вмсловлюватися як умога коротше, що в деяких випадках також ускладнює аналіз.

Використання відмінкових фреймів, як у разі злиття поточного фрейму з попереднім, забезпечує відновлення еліпсиса.

Експертні системи та їх архітектура.

Експертна система - це комп'ютерна програма, що моделює міркування людини-експерта у визначенійобласті, використовуючи для цього БЗ, що містить факти і правила про цю область і деяку процедуру логічного висновку.

РозробкаЕС - порівняно новий напрямок у системах ШІ; друганазва - інженерія знань (термін введено у 1977 Фегенбаум), сформувалася в середині 70 р.

Раніш існував ланцюг: аналітик - програміст - оператор - користувач; тепер користувач може звертатися безпосередньо до ЕОМ (або тільки через інженера по знаннях).

Структура ЕС:

раніш: вхідні даніпрограм тепер:вхідні даніінтерпретатор БЗБЗ

Звичайні програми мають фіксовану послідовність кроків, строго визначену програмістом, ЕС користуються знаходженням задовільного рішення методом спроб і помилок.

ЕС вирішують важко формализуємізадачі, які не мають алгоритмічного вирішення () медицина, геологія, керування, юридичні науки).

Що зумовило появу ЕС:

орієнтованість на вирішеннязадач у неформалызованихобластях

призначеність для користувачів, що не мають спецыаальних навичок програмування

ЕС вирішують задачы краще, ніж людина.

ЕС повинна мати спроможністьодержувати знання. Існує 2 джерела придбання знань:

1) від експерта

2) із текстів

ЕС вирішують практичні задачі, а не експериментальні; рішенняЕС можуть бути пояснені користувачу, тобто мають властивість прозорості, для цього існує спеціальний компонент - пояснювальний.

Формальна основа ЕС: базове поняття - правило продукції або формальні процедури системи: правила видуумова -> діяякщо -> те (якщо було розлито пальне - товикликайте пожежних).

Архітектура ЕС

Користувач ЕС

Спілкування на ПМ

Лігвітсичний компонент аналізу із синтезу вхідних повідомлень

робоча пам'ять

поточнийстан проведення експертизи

пояснювальний компонент

інтерпретатор

компонент придбання знань

БЗ

БЗ має динамічний характер, містить факти і правила у формі продукцій

інтерпретатор має справу з процедурами логічного висновка, на основі наявних даних вирішує задачу

лінгвістичний процесор здійснює діалог із користувачем

робоча пам'ять зберігає дані

компонент придбання знань - із його допомогою знання отримуються від експерта або тексту і заносяться до БЗ

пояснювальний компонент відповідає на запитання, чому прийняті nfrs рішення і чим мотивовано вибір.

Гіпертекстові системи

Гіпертекст - це текст, значимі елементи якого можуть читатися в різній послідовності.

Послідовність читання - довільна. Між текстовими фрагментами визначено дозволені переходи. Як правило, від одного фрагмента можна перейти до декількох інших. Читати можна з будь-якого елемента у різних напрямках. Комп'ютери дозволяють миттєво переходити від одного фрагмента тексту до іншого, що дозволяє читати нелінійні так само легко, як лінійні.

Гіпертекст – комп’юторізований нелінійний текст. Нельсон і Энгельбарт вперше реалізували ГТ наприкінці 60 р.

Особливості ГТ у порівнянні з традиційними нелінійними текстами (текст із коментарями, посиланнями, енциклопедія):

1. явна виразність мережної структури: вузли (текстові фрагменти) і зв'язку (можливість переходу від одного ТФ до іншого -> навігація). Зв'язок може бути однонаправлений від фрагмента до коментарю або двонаправлений між двома фрагментами. Зв'язок може носити ієрархічний характер - від загального до цілого.

Інтерфейс користувача:

перехід - не більш двох клавіш

користувач повинен мати засоби орієнтації: При кожному вузлі дається зміст - локальна орієнтація. Глобальна орієнтація - наочне зображення структури гіпертекстовоїмережі, у якій позначається шлях, пройдений користувачем