Дескриптори приписуються всім повнозначним словам, в основному іменникам та дієсловам, рідко прикметникам та прислівникам.
БІГАТИ
…
DES : дія
Дескрипторів може нараховуватися приблизно 100 (рослина, властивість, твір, система, фізика, і т.і.) Частина дескрипторів організована у ієрархічні структури.
Зона синтаксичних ознак та дескрипторів типового власника
Зона GOV передбачується у словникових статтях прикметників, прислівників, прийменників та сполучників. В цій зоні записуються дескриптори та синтаксичні ознаки типового синтаксичного власника ключового слова.
Типовим власником прикметника є іменник, зв'язаний з ним визначниковим відношенням.
У прислівника – це дієслово чи прикметник. У прийменника та сполучника – дієслово, прикметник та іменник.
СКЛЯНИЙ І:
…
POR : A
GOV : DES (G) = артефакт.
Зона GOV містить інформацію про пасивні валентності слова.
Зона моделей керування містить таку інформацію
· число глибинно-синтаксичних октантів ключового слова;
· засоби їх вираження
· семантичні, лексичні та синтаксичні властивості слів, які можуть виражати дане октантне місце;
· умови сумісної реалізації різних актантів у реченні.
Модель керування має вигляд таблиці, кількість стовпчиків котрої відповідає числу актантів ключового слова. У верхньому рядку кожного стовпчика вказується символ М та номер актанту.
У наступних рядках таблиці записується відомості про слова та групи слів, які виражають дане актантне місце. Ці відомості складаються з вказівки частини мови слова, його синтаксичних ознак та морфологічних характеристик, символів стандартних піддерев та конкретних лексем.
Наприклад, модель керуванні дієслова ДІЗНАВАТИСЯ І виглядає так:
М1 | М2 | М3 |
1. (NP), наз2. (APPROX) | (NP), знах(APPROX)(V), особ(Q U)ТЕ, знах ЩО*Про2* ЩО*Про2. ТЕ ЩО | В 2УЗІЗВІД(Adv, locat) |
NP – іменник, прикметник, чисельник, чи кількісно-іменна група (один з них). APPROX означає, що перший та другий актанти можуть бути вираженими кількісно-апроксимативною групою (біля ста чоловік). QU – вказує на різні типи непрямого питання (Дізнатися, чи буде потяг). (V) вказує на можливість конструкції “Я дізнався, він не приїде.”. * перед ЩО словами вказує на семантичну ненаповненість сполучника, на відміну від сполучникового слова ЩО (На відміну “Я дізнався, що ти привіз.”) * ставиться також перед семантично пустими прийменниками. Номер 2 при прийменнику вказує на місцевий відмінок. Третій актант описує позначає джерело інформації.
Також необхідно знати не тільки синтактико-морфологічні способи оформлення актантів, але і семантичні ознаки та синтаксичні особливості слів, які заповнюють ту чи іншу валентність. Такі відомості записуються безпосередньо під моделлю керування у вигляді обмежень на дескриптори та синтаксичні ознаки актантів. Для нашого випадку це буде
DES (M1) = людина
DES (D 3.1) = група
DES (D 3.2) = людина
DES (D 3.3) = інформація/текст
DES (D 3.4) = інформація/текст
DES (D 3.5) = людина
Неможна сказати “Камінь дізнався про це від інституту”.
Крім відомостей про дескриптори та синтаксичні ознак, умови до моделі керування можуть містити таку інформацію:
· вказівка на обов’язкове і-те місце (Мі <> 0)
· вказівка на невідокремлювання чи непоєднюваність місць чи засобів їх вираження, наприклад якщо M1 <> 0, то М2 <>0.
· вказівка на присутність/відсутність синтаксичних зв’язків у ключового слова та у слів, що замінюють актанти;
· вказівка на морфологічні характеристики ключового слова при поєднанні його з певними засобами вираження актантів; наприклад для MG слова ВАГА одна з умов каже: атриб
якщо M2 = D 2.2, то X(S) –> kw та kw = оруд.,
· тобто регламентується вживання таких конструкцій, як “штанга вагою 150 кг”, а не “штанга ваги 150 кг”.
· вказівка на взаємну трансформуємість різних виразів одного актантного місця
· вказівка на кореферентність актантів (COREF Mi, Mk)
· вказівка на співпадання актантів ключового слова та актантів його залежних (COREF (Mi, Mj(Mk)) та Mi це Mj(Mk).
· вказівка на порядок актантних залежних слів відносно ключового слова і один одного
Якщо слово має декілька моделей керування, умови в кожній з них записуються безпосередньо після моделі, а потім вказується спосіб перетворення однієї моделі в іншу з необхідними умовами цього перетворення.
В даній зоні подаються значення лексичних функцій від ключового слова.
Зона LF складається з рядків; кожен рядок містить значення певної ЛФ. Значенням ЛФ може бути окрема лексема, декілька різних, проте синонімічних одна до одної лексем, невироджене піддерев ГСС чи декілька таких дерев. Рядок починається ім’ям ЛФ (вхід рядку), потім через знак = йдуть одне чи декілька значень даної ЛФ, ті чи інші значення можуть йти з умовами. Лексичні функції можуть розрізнятися по деяким ознакам. Основними ознаками є 1)елементарність/неелементарність 2)стандартність/нестандартність 3)склеюваність/несклеюваність.
Елементарними ЛФ є такі ЛФ, ім’я котрих складається з одного символу (можливо, з цифрами-індексами позаду чи попереду).
Приклад деяких стандартних ЛФ: A0, Able, Adv0, Caus, Anti, Syn та ін.
До елементарних функцій належать також нестандартні функції, що складаються з символу f з цифровим індексом (2f (ВЕЛИЧИНА) = абсолютний). При цьому вирази вигляду Caus 13f, що містять символи елементарних стандартних чи нестандартних ЛФ, вважаються неелементарними ЛФ. Неелементарні (складні) функції отримують з елементарних шляхом операції суперпозиції і композиції.
Нестандартні ЛФ описують ті вирази, котрі співвідносяться з ключовим словом ідіоматичним образом чи необхідним для перекладу, проте не можуть бути задані за допомогою елементарних чи складних стандартних ЛФ. Нестандартні ЛФ позначаються літерою F з цифровим індексом-номером на початку.
Приклад нестандартних ЛФ у словниковій статті до слова АТОМ:
1F = гарячий
2F = XВІДДАЧА
2
YЕНЕРГІЯ,од
attr
ZВЕЛИКИЙ
3F = розщеплений
В словниках різних мов у словникових статтях слів-еквівалентів цифрові індекси при нестандартних ЛФ, які є перекладами одна іншої, повинні співпадати.
Функція Y = f(kw) – несклеювання функція, якщо смисл Y не містить у собі смислу ключового слова. (Magn (ДОЖДЬ) = проливной) (рос.)
Функція Y = //f(kw) – склеювання функція, якщо смисл Y цілком містить у собі смисл ключового слова. (//Magn (ДОЖДЬ) = ЛИВЕНЬ) (рос.)
Зона неформальних коментарів та ілюстрацій
У будь-якому місці словникової статті можуть наводитися коментарі, пояснення та приклади, які не розраховуються на безпосередню автоматичну обробку і призначені для читача-людини.
З одного боку, все, що я розглянув, (а це далеко не повний опис того всього, що використовується і вживається у мові словникових статей ТКС), з першого погляду є дуже громіздким. Проте ця мова є достатньо формалізована для того, щоб використовуватися при перекладі, а без такого словника комп’ютерний переклад текстів максимально близький до природної мови є неможливим.
Тому сучасні системи комп’ютеризованого перекладу повинні враховувати семантичні зв'язки у реченнях та у тексті в цілому, і повинні спиратись на могутній словник, який містить детальну інформацію про мови, з якої і на яку проводиться переклад.
1. Актуальні питання практичної реалізації систем автоматичного перекладу, Частина 2, Видавництво Московського Університету, 1982
2. Мельчук І.А., Опит теорії лінгвістичних моделей “Смисл - Текст”, 1974