Смекни!
smekni.com

"возможности применения ит в лингвистике" 5 (стр. 2 из 7)

В книге А.В. Зубова также освещаются такие вопросы, как:

· основные составляющие ИТ (структура ИТ, методы решения задач с помощью ИТ, алгоритм и его свойства, способы записи алгоритмов, аппаратное и программное обеспечение ИТ);

· общие принципы решения лингвистических задач методом моделирования;

· ИТ в обработке текстов (автоматическое чтение текста, системы автоматического реферирования и аннотирования текстов, машинный перевод текстов);

· ИТ в обучении языкам (создание технологии компьютерного обучения, компьютерные программы индивидуализированного обучения языкам, дистанционное обучение иностранным языкам);

· БД и лингвистические информационные ресурсы (способы организации БД, системы управления БД, терминологические словари, письменные текстовые массивы)

· основы компьютерных телекоммуникаций (компьютерные сети, глобальная сеть Интернет).

Важно отметить, что изложение материала в пособии построено таким образом, что лингвисту становится понятно, что знание компьютера, умение обращаться с ним не требует усвоения основ математики, что каждый филолог может стать основным участником работ по созданию компьютерных систем обучения, систем автоматического анализа и синтеза текстов, систем автоматического поиска, аннотирования, реферирования и перевода текстов.

В учебном пособии "Основы искусственного интеллекта для лингвистов" А.В. Зубов и И.И. Зубова заостряют внимание на том, что "необходима глубокая интеграция ИТ с лингвистическими и психологическими знаниями в рамках искусственного интеллекта" [ 5, с. 10], что "современное состояние исследований по искусственному интеллекту характеризуется нарастанием интереса к этой проблеме со стороны специалистов широкого профиля, в том числе и лингвистов" [5, с. 10].

Система искусственного интеллекта понимается как "компьютерная система, способная получать результаты, которые традиционно рождаются в процессе интеллектуальной творческой деятельности человека" [5, с. 10].

По мнению авторов, введение в вузах специализаций, направленных на изучение возможностей компьютеров в обработке речи и текстов ("Прикладная лингвистика", "Компьютерная лингвистика", "Автоматическая обработка естественного языка", "Компьютерное обучение языкам", "Лингвистика и новые ИТ") является необходимым условием дальнейшего развития информационного общества.

В книге рассматриваются следующие проблемы:

· интеллект и искусственный интеллект, основные задачи искусственного интеллекта, системы общения с компьютером на естественном языке;

· экспертные системы, основные этапы их создания;

· системы обработки связанных текстов, теоретические аспекты порождения текстов, системы порождения прозаических текстов (пословиц, поговорок, загадок, технических описаний, рекламных текстов, рассказов, романов), системы порождения русских стихотворных текстов;

· система машинного перевода текста как система искусственного интеллекта.

Таким образом, А.В. Зубов и И.И. Зубова предприняли попытку показать роль языка в создании систем искусственного интеллекта, моделирующих отдельные функции человека и помогающих ему в решении многих необходимых задач. В то же время результаты работы описанных в пособии естественно-языковых систем показывают, что они еще достаточно далеки от реальных текстов, создаваемых человеком.

Отличительной особенностью данного пособия является его практическая направленность, благодаря которой читатель-лингвист при наличии желания сам сможет создавать модели порождения текстов, подобные описанным в книге.

Учебное пособие Н.Н. Леонтьева "Автоматическое понимание текстов: системы, модели, ресурсы" обобщает опыт создания российских и зарубежных систем, реализующих АПТ. Эти сложные интеллектуальные системы выделяются из множества систем, в которых просто используется автоматическая обработка текста (АОТ), поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия – идея "мягкого" понимания текста. Представлена экспериментальная лингвистическая система ПОЛИТЕКСТ, осуществляющая гибкое соединение лингвистических и предметных знаний.

К системам, реализующим АПТ, автор относит "системы машинного перевода, системы автоматического индексирования, системы информационного анализа массивов официальных документов и текстов СМИ, фактографические системы, системы общения на естественном языке с БД и другие сложные интеллектуальные системы" [8, с. 10].

Наибольший интерес в книге представляют следующие аспекты:

· Взгляд "сверху" на системы АПТ (основные задачи и классы систем АПТ, модель "мягкого понимания" текста).

· Машинный перевод как среда создания систем АПТ (классификация систем МП, лингвистическое обеспечение систем МП).

· Компонент первичного анализа текста, компоненты морфологического и синтаксического анализа, локальный семантический анализ текста, глобальный семантический анализ и сжатие текста.

· Системы генерации текста.

· Корпусная лингвистика и другие лингвистические ресурсы для АПТ.

Учебное пособие "Новые информационные технологии в лингвистике" Р.К. Потаповой посвящено современным проблемам использования новых ИТ в лингвистике и лингвистическом образовании. С учетом специфики данного аспекта знаний в пособии нашли отражение такие направления, как динамика становления интеллектуальных систем обучения, компьютеризация обучения в гуманитарных областях знаний (включая иностранный язык), назначение, специфика и концепция дистанционного обучения (ДО), гипертекст в лингвистике, новые ИТ и лингводидактика, автоматизированные обучающие системы.

Под ДО Р.К. Потапова понимает "одно из новых направлений ИТ в образовании, которое связано с внедрением компьютерных сетей при передаче данных и позволяет осуществлять обучение независимо от расстояния" [12, с. 270]. А под информатизацией лингвистического образования понимается "внедрение таких средств и методов обучения языковой и межкультурной коммуникации, которые основаны на использовании новых ИТ для погружения в аутентичную языковую и культурную среду" [12, с. 273].

Автор книги замечает, что новые ИТ открывают широкие перспективы для разработки и эксплуатации новых образовательных технологий, направленных на создание представительных корпусов текстов, электронных словарей разных типов, справочных таблиц, текстовых массивов, а также программных электронных продуктов (анализирующих, синтезирующих, обучающих программ). К числу электронных продуктов лингвистического профиля Р.К. Потапова, например, относит различные типы электронных словарей, системы автоматизированного перевода, гипертекстовые системы энциклопедического типа, электронные БД, экспертные лингвистические системы, обучающие программы.

В пособии А.В. Всеволодовой "Компьютерная обработка лингвистических данных", наряду с базовыми понятиями, методами и приемами использования средств вычислительной техники, рассмотрены передовые информационные и коммуникативные технологии глобальных компьютерных сетей; изложены основные направления фундаментальных исследований и коммерческих разработок, находящихся на пересечении лингвистики, методов представления, обработки знаний и самых современных ИТ; рассмотрены типичные и специальные приложения КЛ.

Значительное место автор отводит классификации лингвистических программ, детальному описанию их свойств и назначения, для чего размещает в Приложении Каталог лингвистических программ и ресурсов. Данный каталог взят из Русской виртуальной библиотеки. Программы, представленные в нем, будут рассмотрены в следующей главе.

Таким образом, упомянутые выше и многие другие существующие пособия и книги, посвященные взаимодействию ИТ и лингвистики, свидетельствуют об актуальности данной проблемы, а также о повышенном внимании к ней как со стороны специалистов в сфере ИТ, так и со стороны филологов.

глава 2. основные лингвистические программы и ресурсы, представленные в сети интернет

На сайте Русской виртуальной библиотеки представлен Каталог лингвистических программ и ресурсов в Сети, составленный С.В. Логичевым [9]. Данный каталог включает в себя описание программ, связанных с анализом текстов и вычислительной лингвистикой, а также соответствующих ресурсов, доступных сегодня в глобальной сети Интернет. Упор при составлении каталога, по словам автора, делался на бесплатные программы, доступные для загрузки или использования в режиме on-line. Также описаны коммерческие версии некоторых наиболее интересных программ. Тематически каталог разбит на следующие разделы:

· программы анализа и лингвистической обработки текстов;

· программы преобразования текстов;

· психолингвистические программы;

· генераторы текстов;

· системы обработки естественного языка и машинного перевода;

· каталоги и коллекции ресурсов;

· словари и тезаурусы;

· поисковые машины и системы полнотекстового поиска;

· системы синтеза и распознавания речи.

Рассмотрим наиболее интересные и полезные, на наш взгляд, программы.

2.1. Программы анализа и лингвистической обработки текстов

Link Grammar Parser – это синтаксический парсер (то есть синтаксический анализатор) английского языка. Работает со словарем, включающим около 60000 словарных форм.

Проекты Cibola/Oleada реализуют обширные компьютерные системы лингвистического анализа текстов. Компоненты системы включают средства работы с мультиязыковыми текстами, построения конкорданса для текстов на более чем 16 языках, статистического анализа, автоматического перевода, различные словари и тезаурусы.