Еще до возникновения проблематики машинного перевода некоторые лингвисты выступили с попытками как обоснования принципов общей теории перевода, построенной на лингвистических началах, так и с частными разработками, в которых эти принципы реализуются [10].
Рассматривая проблему машинного перевода, А.А. Ляпунов говорил о переводе путем извлечения смысла переводимого текста и его представления на другом языке. Однако такая постановка проблемы перевода оказалась в то время преждевременной. Более того, она не решена в общем виде мировой информатикой и в настоящее время, несмотря на усилия, предпринимавшиеся Международной федерацией IFIP - мировым сообществом ученых в области обработки информации. Однако многие частные результаты, связанные с семантическим анализом текстов, были получены и опубликованы в трудах IFIP.
Первый опыт создания программ машинного перевода показал, что необходимо решать эти проблемы постепенно и по частям. Необходимо было решить следующие вопросы:
- как нужно формализовать и строить алгоритмы для работы с текстами?
- какие словари надо вводить в машину?
- какие лингвистические закономерности следует использовать при машинном переводе?
- каковы все эти закономерности?
Выяснилось, что традиционная лингвистика не располагает ни фактическим материалом, ни идеями и представлениями, нужными для построения систем машинного перевода, которые использовали бы смысл переводимого текста. Традиционная лингвистика не могла дать исходные представления не только в части семантики, но и в части синтаксиса. Ни для одного языка в то время не существовало перечней синтаксических конструкций, не были изучены условия их сочетаемости и взаимозаменяемости, не были разработаны правила построения крупных единиц синтаксической структуры из более мелких. В сущности ни на один вопрос, поставленный в связи с построением систем машинного перевода, традиционная лингвистика в 50-х годах не могла дать ответа.
Как было сказано выше, потребность в создании теоретических основ машинного перевода привела к формированию нового направления в лингвистике - структурной, прикладной, математической лингвистики. Формирование этого направления в СССР относится ко второй половине 50-х годов. Ведущую роль в нем сыграли математики А.А. Ляпунов, В.А. Успенский, О. С. Кулагина, лингвисты В.Ю. Розенцвейг, П.С. Кузнецов, А.А. Реформатский, И.А. Мельчук, В.В. Иванов.
Под математической лингвистикой понималось изучение языка как абстрактной знаковой системы с целью построения теоретической основы машинного перевода и создания конкретных алгоритмов перевода. В таком понимании математическая лингвистика составляла часть семиотики - общей теории знаковых систем[11].
Задача аксиоматизации лингвистики была выдвинута одним из виднейших лингвистов московской школы П.С. Кузнецовым как задача формализации грамматики, восходящая к идеям выдающегося русского языковеда Ф. Ф. Фортунатова (1848-1914). Исследованию формальной теории грамматик, была посвящена диссертация О.С. Кулагиной, выполненная под руководством А. А. Ляпунова. В те же годы формальная теория грамматик развивалась в США в трудах Н. Хомского, ставших классическими для области искусственных языков, в частности языков программирования.
Двадцатилетие (1956-1976) один из основателей направления математик В. А. Успенский в своих воспоминаниях назвал "серебряным веком" структурной, прикладной и математической лингвистики в СССР. В 70-х годах разработку основ технологии машинного перевода продолжила группа специалистов в ВИНИТИ под руководством профессора Г.Г. Белоногова. В результате в 1993 г. была создана промышленная версия системы RETRANS фразеологического машинного перевода с русского языка на английский и обратно, которая применялась в министерствах обороны, путей сообщения, науки и технологий, а также во ВНТИЦ. Практическое применение принципов смыслового анализа текстов потребовалось при создании систем машинного перевода с иероглифических языков (китайского, японского и др.). Вопросы создания таких систем были разработаны в диссертации В. М. Зелко в 80-х годах.
Первые коммерческие продукты машинного перевода, нашедшие практическое использование, появились в середине 80-х годов. Они были реализованы на персональных компьютерах и являлись системами прямого перевода, возможности которых базировались на огромных (по сравнению с первыми системами) словарях, а не на умении анализировать и синтезировать тексты[12].
2. ОБЩЕЛИНГВИСТИЧЕСКИЕ ВОПРОСЫ
МАШИННОГО ПЕРЕВОДА
2.1. Проблема переводимости
Проблема переводимости связана с тем, что действительность по-разному членится разными языками. Именно исходя из этого факта, многие лингвисты ставили под сомнение возможность перевода текстов с одного языка на другой. Наиболее ярко идея несводимости друг к другу двух картин мира, описываемых разными языками, была высказана в лингвистике В.Гумбольдтом: «Каждый язык описывает вокруг народа. Которому он принадлежит, круг, из пределов которого можно выйти только в том случае, если вступаешь в другой круг. Изучение иностранного языка можно было бы поэтому уподобить приобретению новой точки зрения в прежнем миропонимании; … только потому, что в чужой язык мы в большей или меньшей степени переносим свое собственное миропонимание и свое собственное языковое воззрение, мы не ощущаем с полной ясностью результатов этого процесса»[13].
Нет основания отрицать полностью мысль о непереводимости. Нет переводчика, который в своей практической деятельности не наталкивался бы на явления, не поддающиеся переводу. Да и теоретически ясно, что существуют такие категории языка, между которыми соответствия установить нельзя, следовательно, нельзя и сохранить инвариантность смысла. Важно, однако, уточнить, какие категории языка имеются в виду, когда говорят о непереводимости.
Разработка правил машинного перевода с одного языка на другой поставила перед лингвистами ряд проблем, которые относятся как к переводу с различных языков и на различные языки, так и к принципам анализа текста на некотором данном языке.
2.2. Проблема грамматических различий в языках
Различие в типе грамматического (и именно морфологического) строя языка обуславливает некоторые различия в характере переводческих правил для данного языка. Необходимость таких различий была обнаружена уже при разработке правил перевода с французского на русский и с английского на русский, поскольку в английском языке отсутствует ряд форм, имеющихся во французском языке, вследствие чего гораздо уже представлено согласование как форма связи между членами словосочетания [14].
Лингвистической задачей машинного перевода является выработка такой системы правил, которая позволила бы, имея некоторый текст на данном языке, однозначно определить, какой текст другого языка должен быть адекватен по смыслу данному тексту. Любой язык имеет словарный состав и грамматический строй. Поэтому любой текст любого языка содержит слова, связанные между собой по нормам грамматического строя данного языка. Различные грамматические связи служат для выражения различных отношений между понятиями, выражаемыми словами. Поэтому правила перевода с одного языка на другой должны содержать, как правила перевода слов, так и правила передачи грамматических средств одного языка, выражающих некоторые отношения, грамматическими средствами другого языка, выражающими те же отношения.
Ввиду различий, существующих между языками, невозможно построить некую единую универсальную систему правил перевода с любого языка на любой, но каждая система правил, какая может быть построена, должна связывать лишь два конкретных языка, притом лишь в одном направлении. Так, например, может быть построена одна система правил для перевода с французского языка на русский, другая – с русского на французский, третья - с английского на русский и т.п. Но в то же время могут быть определены и некоторые общие принципы, т.е. некоторые общие правила для построения различных конкретных систем правил, точно так же, как при всем различии грамматической структуры разных конкретных языков земного шара существуют некоторые общие принципы изучения грамматической структуры языка, на которые, в частности, опирается и классификация языков по их грамматическому типу.
При наличии большого количества языков, которые должны быть связаны переводческими отношениями, встает вопрос, как более целесообразно строить правила перевода для двусторонней связи каждого данного языка с другим в пределах определенной группы. Возможно, что целесообразно сначала переводить на один какой-нибудь язык, через посредство которого осуществляется перевод на другие языки. Операция перевода в этом случае, по-видимому, несколько замедляется, так как любой перевод осуществляется не непосредственно, а двумя этапами: с первого конкретного языка (ИЯ – исходный язык) на язык-посредник (специальный язык), а затем с языка-посредника на другой конкретный язык ПЯ – переводящий язык), но зато потребуется меньшее количество систем правил, чем при переводе непосредственном.
Этот специальный язык может быть языком определенных логических символов, позволяющих передать точно слова и формы реального языка, отобранные таким образом, что он будет характеризоваться теми же свойствами, что и логический язык символов.
Правила перевода с любого данного языка на любой другой содержат, как уже было сказано, правила перевода слов и правила перевода грамматических средств (именно средств, а не форм, так как грамматической формой принято называть форму одного отдельного слова, каковой в некоторых языках может и не быть). Переводы слов содержатся в закодированном в порядке алфавита данного языка словаре. Но должны существовать и некоторые правила перевода слов, так как лишь сравнительно редко одно слово данного языка соответствует одному и только одному слову другого языка. Большей частью слово данного языка соответствует нескольким словам другого языка, и должен быть однозначно определен выбор слова второго языка из нескольких возможных.