Смекни!
smekni.com

Содержание (стр. 1 из 5)

ПРОБЛЕМЫ МАШИННОГО ПЕРЕВОДА

Москва 2003

СОДЕРЖАНИЕ

Введение ……………………………………………………………………….3

1. Машинный перевод как лингвистическая задача

1.1. Возникновение и развитие машинного перевода …………………4

1.2. Возникновение проблем машинного перевода……………………7

2. Общелингвистические вопросы машинного перевода

2.1. Проблема переводимости……………………………………………11

2.2. Проблема грамматических различий в языках……………………..12

2.3. Решение проблем механизации перевода…………………………..16

Заключение …………………………………………………………………..24

Список литературы…………………………………………………………..25

Приложение…………………………………………………………………..26

ВВЕДЕНИЕ

Изменение места перевода в современном мире, а также внутренние потребности самой лингвистики привели к тому, что теоретики начали все более интересоваться конкретными проблемами языковых соответствий и другими чисто лингвистическими аспектами перевода.

Машинный перевод – это шаг к объективному эксперименту в теории перевода и вообще в языкознании.

Машинный перевод предполагает те или иные гипотезы о процессе перевода, которые в дальнейшем проверяются путем моделирования процесса перевода в машине. При такой постановке вопроса машинный перевод играет не только практическую роль, он открывает пути для объективного изучения языковых процессов, имеющих место в переводе. Это в свою очередь должно обогатить и практическую реализацию машинного перевода, а также помочь построению других машин, связанных с языком: машин для перевода устной речи в письменную, информационных машин и т.п.

Актуальность темы данной работы заключается в том, что до настоящего времени еще полностью не решены проблемы машинного перевода, поставленные в 50-е годы XX столетия.

Изучение и последующее решение проблем машинного перевода представляет собой важнейшее направление в современной теории перевода. В эпоху индустриализации общества, в условиях все возрастающего потока информации и постоянно развивающихся компьютерных технологий настало время вплотную подойти к решению этих проблем, начало которым было положено с момента возникновения самого машинного перевода.

Актуальность темы заключается и в том, что решение этих проблем имеет решающее значение для прогресса человечества, и поэтому неудивительно, что как лингвисты, так и разработчики компьютерных переводчиков все большее внимания уделяют этому вопросу.

1. МАШИННЫЙ ПЕРЕВОД КАК ЛИНГВИСТИЧЕСКАЯ ЗАДАЧА

1.1. Возникновение и развитие машинного перевода

Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической машины - механического прототипа электронных цифровых вычислительных машин, появившихся через 100 лет[1].

Фактически история машинного перевода начинается с "Джорджтаунского эксперимента" (США). В январе 1954 г. состоялась первая публичная демонстрация машинного перевода с русского языка на английский, осуществленного на машине ИБМ-701. Сообщение об этом событии было опубликовано в журнале Computers and Automation, 1954, № 2. Реферат этого сообщения, сделанный Д.Ю. Пановым, появился в РЖ ВИНИТИ "Математика", 1954, № 10: "Перевод с одного языка на другой при помощи машины: отчет о первом успешном испытании"[2].

Это сообщение явилось толчком для начала работ по машинному переводу в СССР. Первый опыт перевода с английского языка на русский с помощью машины БЭСМ был получен уже к концу 1955 г. Программы для БЭСМ составляли Н. П. Трифонов и Л. Н. Королев, кандидатская диссертация которого была посвящена методам построения словарей для машинного перевода.

Впрочем, основа для успехов отечественных ученых закладывалась намного раньше. В 1920-х годах в России велись интенсивные исследования по семиотике текста[3], в то время как широкомасштабное изучение семиотики во всем мире относится только к началу 1960-х годов[4].

Стремительный прогресс семиотики стал основой для сближения лингвистики и математики на почве популярного в 1950-60-е годы математического структурализма. Идеи семиотики объединяли крупнейших ученых, среди которых математик В.Успенский и лингвист В.Иванов. Успехи формального подхода к описанию языка наглядно продемонстрировали возможность превращения чисто гуманитарной науки в логически строгую дисциплину.

Работы по кибернетике и, в частности, по структурной лингвистике, развернутые в конце 50-х годов под руководством академика А.Берга и члена-корреспондента АН СССР А.Ляпунова, вывели отечественную науку на передовые позиции. Уже в начале 1956 года в Институте прикладной математики (ИПМ) им. М.В. Келдыша заработала первая отечественная система машинного перевода с французского на русский язык. Система ФР-I давала перевод более высокого качества, чем у американцев. Математики рассматривали алгоритмы машинного перевода как частные случаи изучаемых в кибернетике алгоритмов перекодирования.

Огромное значение имело выработанное А. Ляпуновым и О. Кулагиной теоретико-множественное представление грамматических категорий языка. Эти результаты были получены независимо от работ Ноама Хомского (Noam Chomsky), считающегося создателем теории формальных грамматик. Большую роль сыграли работы И.Мельчука по автоматическому грамматическому анализу.

Обобщения и систематизация результатов математической лингвистики позволили создать стройную теорию формальных языков. Проблема заключалась в одном: аппарат теории формальных языков был очень хорош для искусственных языков, в частности для языков программирования, но не давал приемлемых результатов для анализа естественного языка и построения адекватной системы машинного перевода.

Искусственные алгоритмические языки в программировании специально создаются так, чтобы было удобно манипулировать формальными конструкциями, описывающими «прозрачную» семантику, которая сводится, как правило, к конкретным действиям. В естественном языке есть нечто большее - буквальная семантика, с которой и связано понимание человеком текста. Понимание это может быть не таким уж простым даже для носителя языка, и связано оно с мыслительными процессами, а не с формальными правилами описания самого языка. Поэтому для автоматического перевода надо уметь описывать смысл фразы, а не ее формальную запись.

Разработка И.Мельчуком и А.Жолковским лексических функций, создание теории «Смысл-Текст» явились колоссальным скачком в построении строгой концептуальной системы, применимой для анализа естественного языка. Суть теории Мельчука можно свести к построению формального семантического языка, на котором и будет описываться смысл текста. Это открывает огромные возможности, как для задач анализа текстовой информации, так и для задач машинного перевода. Реализацией этих возможностей занимался коллектив под руководством академика Ю.Апресяна, разрабатывающий систему машинного перевода ЭТАП. В настоящее время эти очень важные работы продолжаются в лаборатории Института проблем передачи информации РАН, возглавляемой И.Богуславским.

Компьютерная лингвистика стремительно развивалась в СССР в 1960-е годы. Однако в следующем десятилетии работы в области машинного перевода оказались под жестким государственным контролем, который способствовал прекращению или замедлению многих работ, и исследования по машинному переводу практически прекратились [5].

Первые программы машинного перевода, разработанные коллективом Ляпунова, были реализованы на машине "Стрела". Первое поколение систем машинного перевода базировалось на алгоритмах последовательного перевода "слово за словом", "фраза за фразой". Возможности таких систем определялись доступными размерами словарей, прямо зависящими от объема памяти компьютера. Перевод текста осуществлялся отдельными предложениями, смысловые связи между ними никак не учитывались - системы прямого перевода[6].

На смену им со временем пришли системы последующих поколений, в которых перевод от языка к языку осуществлялся на уровне синтаксических структур. В алгоритмах перевода использовался набор операций, позволяющий путем анализа переводимого предложения построить его синтаксическую структуру по правилам грамматики языка входного предложения, а затем преобразовать ее в синтаксическую структуру выходного предложения и синтезировать выходное предложение, подставляя нужные слова из словаря. Такие системы называются Т-системами (Т - от английского слова "transfer - преобразование").

Наиболее совершенным считается подход к построению систем машинного перевода на основе получения некоторого, независимого от языков, смыслового представления входного предложения путем его семантического анализа. Затем производится синтез выходного предложения по полученному смысловому представлению. Такие системы называют И -системами (И - от слова "интерлингва"). Считается, что следующие поколения систем машинного перевода будут относиться к классу И-систем[7].

Пока неизвестно, какие возможности даст человечеству надвигающаяся новая компьютерная революция. Однако можно надеяться, что компьютерная лингвистика перейдет на совершенно новую технологическую базу, основа которой закладывается в наше время [8].

1.2. Возникновение проблем машинного перевода

Проблематику автоматического машинного перевода в последние годы все чаще относят к особой научной дисциплине под названием «компьютерная лингвистика», основная проблема которой состоит в том, что компьютеры «не желают различать смысловые оттенки и выдавать красивые литературные переводы»[9].