Смекни!
smekni.com

Электронные словари и их применимость для традиционного машинного перевода (стр. 1 из 13)

Нижегородский государственный

лингвистический университет

им. Н.А. Добролюбова

дипломная работа

на тему

Электронные словари

и их применимость

для традиционного

машинного перевода

Выполнил:

студент гр. 503А Тараскин А.А.

Научный руководитель:

к.ф.н. доц. Яржемский А.Н.

Нижний Новгород, 2003 г.


Содержание:

Введение________________________________________ 3

Глава I. Место лексикографии среди
лингвистических дисциплин._______________________
5

a. Лексикография как одна из наук о языке.____________ 6

b. Типы словарей._________________________________ 8

c. Составление словарей.___________________________ 22

Глава II. Электронные словари.____________________ 24

a. Электронные словари "МультиЛекс"._______________ 24

b. Электронные словари "Lingvo".____________________ 25

c. Преимущества электронных словарей.______________ 26

d. Новые мехи требуют нового вина.__________________ 29

e. Читатели и писатели._____________________________ 30

f. Проблема актуальности.__________________________ 31

g. Соответствие уровню достижений
лингвистической науки.__________________________ 31

Глава III. Машинный перевод._____________________ 33

a. Немного истории._______________________________ 33

b. Классификация систем машинного перевода
по Лари Чайлду.________________________________ 34

Полностью автоматизированный МП.______________ 34

Автоматизированный МП
при участии человека.___________________________
35

Перевод, осуществляемый человеком
с помощью компьютера._________________________
35

c. Системы машинного перевода.____________________ 37

Система МП Retrans Vista._______________________ 40

Система МП PROMT XT._________________________ 43

Глава IV. Практическая часть._____________________ 49

Заключение______________________________________ 54

Библиография___________________________________ 56

Введение.

В настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации. В этой связи компьютерные словари являются очень удобным подручным средством в целях экономии времени и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас имеются программы-переводчики, которые могут производить более или менее адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей. Данная работа посвящается изучению указанных проблем, а также анализу некоторых лингвистических программных продуктов, направленных на автоматизацию процесса перевода.

Настоящую тему исследования можно считать вполне современной, поскольку история развития и внедрения в повседневную жизнь персональных компьютеров (а тем более таких, каким было бы 'под силу' осуществлять более или менее современные программы машинного перевода) насчитывает едва ли более пятнадцати лет. Особую актуальность эта тема приобретает, если учесть тот факт, что именно в настоящее время Россия все более интегрируется в международное сообщество и что, наряду с экономическими и политическими барьерами,препятствуют этому во многом барьеры языковые. Вместе с тем, профессиональных переводчиков, способных и желающих осуществлять подобный процесс коммуникации сообществ во всех сферах науки и культуры, не так много, следствием чего является тот факт, что услуги их недешевы. Поэтому именно сейчас особенно актуален поиск путей максимально автоматизировать процесс перевода, осуществляемого человеком, чтобы, с одной стороны, максимально облегчить нелегкий труд человека-переводчика, а с другой - сделать этот труд максимально эффективным. Осуществить подобное можно, лишь максимально интегрировав усилия специалистов в областях кибернетики, программирования, психологии, а главное - лингвистики.

Цель данной работы - определение того, насколько можно использовать современные программные продукты для осуществления перевода, а также выявление наиболее перспективных, на наш взгляд, направлений исследований в области его автоматизации.

В соответствии с поставленной целью, задачами исследования являются:

- уяснение местоположения компьютерной лексикографии среди лингвистических наук;

- уяснение различий между электронными и традиционными бумажными словарями;

- определение максимально эффективного способа организации электронных словарей;

- уяснение различий между разнообразными системами МП и классификации последних;

- анализ работы систем машинного перевода на примере перевода, произведенного программой PROMT XT, и сравнение образцов перевода с переводом, сделанным человеком. Анализ причин несоответствия.

Глава I.МЕСТО ЛЕКСИКОГРАФИИ СРЕДИ
ЛИНГВИСТИЧЕСКИХ ДИСЦИПЛИН

Слово «лексикография» греческого происхождения, lexikos — относящийся к слову, словарный и grapho — пишу. Следовательно, лексикография означает: «пишу сло­ва» или «пишу словари». В современном значении лексико­графия — это теория и практика составления словарей, главным образом языковых, лингвистических, в отличие от неязыковых, энциклопедических.

Лексикография как научный термин появилась в широ­ком обиходе сравнительно недавно. Например, в энциклопедическом словаре Брокгауза и Ефрона (1896 г.) нет статьи на слово «лексикография», однако есть статья на слово «лексикология». Справедливости ради следует отме­тить, что в статье «словарь» этого же справочника имеется слово «лексикография», где оно является синонимом сло­восочетания «словарная техника».

В энциклопедическом словаре братьев А. и И. Гра­нат (1916 г.) уже есть статья на слово «лексикография», которая определяется как «научные способы обработки словесного материала языка для составления лексикона». Отметим в этом определении акцент на «научные способы обработки».

В первом издании «Большой советской энциклопедии» (1938 г.) в статье на слово «лексикография» дано: «Лексикография (греч.), работа по составлению словарей». И только во втором (1953 г.) и третьем (1973 г.) изданиях этот термин толкуется достаточно современ­но: «Лексикография — раздел языкознания, занимающийся практикой и теорией составления словарей». (БСЭ, 3-е изд. 1973, т. 14).

С другой стороны, статьи на слово «лексикография» нет ни в энциклопедии «Британика», ни в энциклопедии «Аме­рикана», хотя в обеих есть статьи на слово «словарь». Отсутствие термина «лексикография» в таких солидных совре­менных справочниках, как британская и американская энциклопедии, отнюдь не случайно. Это объясняется, во-первых, молодостью лексикографии как науки и, во-вто­рых, тем, что даже среди самих языковедов до сих пор еще идет спор, является ли лексикография наукой, точнее, частью науки о языке, или же она просто техника со­ставления словарей, в лучшем случае, искусство их со­ставления.

Видный испанский лексикограф X. Касарес в своей широко известной книге «Введение в современную лексико­графию» (которая переведена на русский язык) утверждает, что лексикография — это техника и искусство составления словарей. (Вспомним определение «лексикографии» в пер­вом издании БСЭ: «работа по составлению словарей».)

Известный английский лексикограф, автор знаменитых справочников по английскому и американскому сленгу Эрик Патридж, посвятивший всю свою жизнь составлению сло­варей, не случайно назвал свою последнюю книгу, плод многолетних разысканий в области словарного дела, так: «Благородное искусство лексикографии как объект занятий и опыт страстного его приверженца».

Даже Ф. Гоув, главный редактор третьего издания сло­вари Уэбстера (1461 г.), крупнейшего лексикографического предприятия нашего времени, пишет в программной статье «Успехи лингвистики и лексикография»: «Лексикография еще не наука. По-видимому, они никогда не будет наукой. Однако это сложное, топкое и порой всепоглощающее искусство, требующее субъективного анализа, произвольных решений и интуитивных доказательств".

Лексикография как одна из наук о языке

Существует, однако, другая точка зрения на лексикогра­фию. Ее сторонники считают, что лексикография — это не просто техника, не просто практическая деятельность по составлению словарей и даже не искусство, а само­стоятельная научная дисциплина, имеющая свой предмет изучения (словари различных типов), свои научные и ме­тодологические принципы, свою собственную теоретическую проблематику, свое место в ряду других наук о языке.

Впервые эту точку зрения на лексикографию со всей определенностью высказал известный советский языковед академик Л. В. Щерба. В предисловии к русско-фран­цузскому словарю (1936 г.) он писал: «Я считаю крайне неправильным то пренебрежительное отношение наших квалифицированных лингвистов к словарной работе, благо­даря которому почти никто из них никогда ею не зани­мался (в старые времена это за гроши делали случайные любители, не имевшие решительно никакой специальной подготовки) и благодаря которому она получила такое нелепое название «составление» словарей. И действи­тельно, наши лингвисты, а тем более наши «составители» словарей просмотрели, что работа эта должна иметь науч­ный характер и никак не состоять в механическом со­поставлении каких-то готовых элементов».

Развивая выдвинутые в 1936 г. положения, Л.В. Щерба публикует в 1940 г. статью (ставшую потом широко известной и за рубежом), в которой на большом фактичес­ком материале начинает разрабатывать основные теорети­ческие вопросы лексикографии. Л.В. Щерба мыслил написать несколько статей (этюдов, как он их называл) по общей теории лексикографии, в которых намеревался обсу­дить такие важные проблемы, как основные типы словарей, природа слова, значение и употребление слова, построение словарной статьи в связи с семантическим, грамматическим и стилистическим анализом слова и др. Однако преждевременная смерть помешала осуществлению этого замысла. Л.В. Щербой был написан лишь первый этюд «Основные типы словарей», который начинался следующим хорошо известным сейчас положением: «Одним из первых вопросов лексикографии является, конечно, вопрос о различных ти­пах словарей. В основе его лежит ряд теоретическихпротивоположений, которые и необходимо вскрыть». С тех пор тезис о том, что лексикография — это не только практика составления словарей, но и теоретическая научная дисциплина, прочно вошел в ряд отправных положений советской лексикографической школы.