Задачею цієї системи є послідовна обробка тексту для встановлення кореляційної структури словосполучень та фраз природньої мови. Результат аналізу – кореляційна сітка.
До слів аналізуємої фрази підбираються словарні карти і вводяться в машину. У випадках синтаксично неоднозначних речень система видає декілька варіантів аналізу. Отримані з однієї вхідної фрази різні кореляційні сітки будуть ще раз досліджуватися з метою виявлення семантичних ознак, які потім будуть використовуватися в системі для видалення зайвих елементів.
Власне, “Мультістор” – це ділянка пам’яті машини, відведена для утворення кореляцій за кореляційними індексами слів, яку зручно представляти у вигляді таблиці, що складається з таких стовпчиків:
Ic | ||
CF | 1 | 2 |
… | … |
Зчитуючи індекс кореляції першого слова фрази, машина фіксує цей індекс у відповідній секції CF у вигляді маркеру, що являє таким чином певну кореляційну здатність першого слова. Якщо тепер в другій секції тієй ж колонки Ic з’явиться маркер від другого слова, то це буде означати, що між першим та та другим словами можлива кореляція.
Правила попередньої обробки:
- Приписати кожному слову його порядковий номер у фразі.
- Помістити кожне слово в спеціальний накопичувач слів та записати там відомості, отримані для цього слова з словнику.
Так як у фразі може бути інверсія, деякі слова або кореляці треба відкласти “запам’ятати” , поки не дойдемо до якогось конкретного виразу. Важливо заздалегідь знати, які з кореляцій допускають інвертування, тому в таблиці “Мультістор” ще існують стовпчики N, M, E, F. N – імпліцитні корелятори, шо не допускають інвертування, M – імпліцитні корелятори, що допускають інвертування , E – експліцитні корелятори, що не допускають інвертування , F – експліцитні корелятори, що длпускають івертування.
- Перевірити наявність у фразі експліцитних кореляторів.
- Перевірити чи містить фраза компоненти якогось ідіоматичного виразу, і якщо так, то ввести в дію відповідну програму.
- Перевірити чи містить фраза компоненти якогось складного експліцитного корелятора, що записаний у вигляді окремої таблиці.
Сущность системи “Мультістор” полягає в тому, що в заздалегідь організованій ділянці пам’яті для кожного типу кореляцій відводиться спеціальна позиція. Тому для утворення кореляцій не треба співставляти всі кореляційні індекси кожного слова з усіма кореляційними індексами іншого слова.
Полуавтоматичний переклад з англійської на французьку мови: система “Людина – машинний тезаурус”. М.Мастерман
В праці англійської дослідниці М.Мастерман йдеться про полуавтоматичну систему перекладу, яка діє при участі людини і здатна перекладати окремі абзаци тексту (канадських урядових документів) з англійської на французьку.
В системі використовується тезаурус. В якості запиту в операціях пошуку виступає одиниця, білаша за слово – синтагма. Оператор може з пульту приєднуватися до роботи машини; його прямий діалог з тезаурусом забезпечується процедурами, що написані на мові TRAC.
Головний принцип системи – взаємодія між людиною і машиною. На вхід машини подається розмічена синтагма, де виділені головні члени і вказаний деякий мінімум синтаксичних відомостей про слова, що входять до її складу. Вже існує алгоритм, який розбиває текст на синтагми. Оператор вводить в машину текст по синтагмам, вилучаючи з низ головні члени, які вже заздалегідь відмічені в даному для нього тексті. Це означає, що він набирає не всю синтагму, а лише схему синтагми.
Схеми синтагм:
He …-ed to the …
(дієслово в мин.ч) (іменник)
There is a … in the …
(іменник) (іменник)
Such as …
(іменник)
Отримавши деяку схему синтагми, машина запитує у оператора більш докладну контекстну інформацію, яку він має завдяки знайомству з текстом в цілому і з відповідною тематикою.
Дозволяється не більше трьох турів запитань-відповідей. Після цих трьох турів машина видає вибраний нею правильний переклад даної синтагми.
І етап. І тур.
Оператор друкує конструкцію:
He … -ed to the …
(дієслово в мин.ч.) (іменник)
Машина запитує: Do you mean that:
A. He moved to some point?
B. He deteriorated?
C. He crossed over some obstacle?
D. He communicated with some animate being?
Оператор відповідає А.
ІІ тур.
Машина запитує: Do you mean that:
A. He departed to some destination? Il partit pour…
B. He travelled to some distant region? Il s’en alla …
C. He fled to some refuge? Il se reflugia chez…
D. He arrived at some destination? Il arriva a…
E. He visited some place? Il visita…
Оператор відповідає В.
ІІІ тур. І етап.
Машина запитує: How did he travel?
A. By plane? Il prit l’avonion pour…
B. By sea? Il voyagea en voiture…
C. By train? Il prit le train pour…
D. On foot? Il se rendit a pied a…
E. By bicycle? Il s’en alla a bicyclette a…
F. By swimming? Il alla a la nage a…
Оператор відповідає А.
ІІ етап.
Оператор подає на вхід головні члени синтагми:
flew – летів, frontier – границя
Мшина звертається до словника і вирішує:
…-ed = flew (вже перекладено, пропустити)
… = frontier (frontiere)
І відразу ж для тексту “He flew to the frontier” машина видає переклад:
Il prit l’avion pour la frontiere.
Стратегія системи полягає в тому, щоб уникнути постредагування, зосередившись на прередагуванні перекладного тексту, яке виконується машиною, що взаємодіє з оператором на його рідній мові. Суть методики запитання-відповідь полягає в тому, що вона дозволяє оператору- англічанину, який зовсім не знає французької мови, отримати вірний за смислом та ідеоматичний переклад англійського тексту на французьку мову при умові, що він візьме на себе попередню обробку тексту. Після цього машина видає реальний французький текст.
Будь-яка відповідь оператора на запитання машини дозволяє утворити пару, першим членом якої є англійська синтагма, а другим – “смислове кліше”, уточнення смислу цієї синтагми також англійською мовою. Потім утворюється нова пара, першим членом якої буде це кліше, а другим – французька синтагма з вже перекладеними і поставленими на свої місця головними членами. Такі парні відповідності мають назву семантичних квадратів.
Таким чином, переклад складається з послідовної побудови семантичних квадратів, яка продовжується до тих пір, поки не буде отриманий квадрат, другим членом якого є синтагма вихідної мови.