Смекни!
smekni.com

работа по дисциплине (стр. 1 из 2)

файл: krab1_09.doc

Курсовая работа

по дисциплине

“Семиотика информационных технологий”

для студентов групп ИУ5 – 91, 92, 93, 94.

(2009 — 2010 уч.год)

Вариант 1. — Анализ текста компьютерного журнала.

Цель курсовой работы:

Приобретение навыков исследования естественно-языкового описания предметной области.

Задачи курсовой работы:

– изучение материалов лекционных и практических занятий по дисциплине «Семиотика информационных технологий» (разделы лекционных курсов — теория частот слов, формальные языки информационных технологий, структура и состав словарной компоненты баз лингвистических знаний, тезаурус, лингвистические процессоры и др.; практические занятия — исследование частотных характеристик фрагмента естественно-языкового описания предметной области, исследование словаря определений, индексирование фрагмента текста, построение графа дефиниций и др.; специальное информационное программное обеспечение — программные изделия LemmaLex, Interlex, FineStyle, текстовые файлы журналов по предметной области "Информатика и системы управления"; основная и дополнительная литература — см. список программ дисциплин);

– приобретение навыков анализа и изучение методов и приемов исследования ЕЯ описания предметной области (ПО) в процессе выполнения заданий курсовой работы;

– приобретение знаний и навыков интегрированного использования программного обеспечения АСОИУ (текстовых процессоров, СУБД, электронных таблиц, специального программного обеспечения и других программных средств) для проведения анализа и исследования ЕЯ описания ПО;

– приобретение знаний и навыков по оформлению результатов анализа и исследования ПО при оформлении курсовой работы.

Задания курсовой работы.

1. Провести частотный анализ ЕЯ описания ПО.

2. Составить предметный (терминологический) и именной указатели.

3. Провести индексирование фрагментов ЕЯ описания ПО.

4. Провести анализ использования метафоры в ЕЯ описании ПО.

5. Составить грамматический словарь.

6. Составить конкорданс.

7. Составить словарь определений терминов.

8. Составить словарь метафор.

9. Составить информационно-поисковый терминологический тезаурус.

Порядок выполнения курсовой работы.

1. Получить у преподавателя методические материалы для выполнения курсовой работы (скопировать на дискету текстовые и программные файлы).

2. Последовательно выполнить задания 1–9 курсовой работы.

3. Оформить результаты курсовой работы.

4. Апробировать результаты курсовой работы у преподавателя.

Пояснения, рекомендации и требования к выполнению курсовой работы.

Задание на выполнение курсовой работы необходимо получить у преподавателя в течение первых двух недель семестра. После получения методических материалов курсовой работы рекомендуется внимательно их прочитать и изучить. Хорошее знание материалов в дальнейшем позволит качественно выполнять такие задания курсовой работы как: составление указателей, индексирование текста, составление словаря определений, составление тезауруса. Затем необходимо выбрать и согласовать с преподавателем информационный ресурс ПО (компьютерный журнал) такой как: "Мир ПК"; "Компьютер-Пресс"; "PC-Magazine"; "Byte (Россия)"; "Открытые системы"; "Микропроцессорные средства и системы"; "Электроника"; "Программирование"; "Программные продукты и системы"; "Теория и системы управления"; "Communication ACM". Hard&Soft, LAN и др. После согласования его следует также внимательно прочитать. Рекомендуется выполнять задачи курсовой работы в указанной последовательности.

Задание 1.

При проведении частотного анализа ЕЯ описания ПО необходимо выполнить следующие работы для фрагментов и всего текста:

– разбить текст на фрагменты (по статьям);

– построить частотные словники;

– построить графики ступенчатой функции распределения частот;

– вычислить основные частотные характеристики и представить их в таблицах;

– построить графики распределения частот слов.

Задание 2.

В предметный (терминологический) указатель должны быть включены основные термины и понятия соответствующей ПО, выраженные словами, словосочетаниями (2-х и 3-х словными). Отдельно должны быть представлены аббревиатуры. Указатель должен содержать сведения об имени файла текстового фрагмента (статьи) и номере страницы в печатной версии журнала. Общее число понятий предметного указателя должно быть не менее 100. При формировании предметного указателя рекомендуется использовать в качестве дополнительного справочного материала переводные и толковые словари по соответствующей ПО (вычислительная техника, базы данных и др. существующие как в виде полиграфических изданий, так и в виде электронных версий, например, КОНТЕКСТ — фирма ИНФОРМАТИК, STYLUS LINGUA COLLECTION — фирма STYLUS и др. )

В именной указатель ЕЯ описания ПО должны быть включены все имена собственные, встретившиеся в текстовых фрагментах (статьях), включая наименования фирм и информационно-программных изделий и их аббревиатуры. В указателе должны быть выделены разделы: персоналии, топонимы, организации, продукция и др. Указатель должен содержать сведения об имени файла текстового фрагмента (статьи) и номере страницы в печатной версии журнала.

Задание 3.

При индексировании текстовых фрагментов (статей) для каждого из них должны быть составлены поисковые образы, включающие 10–20 ключевых слов, словосочетаний, аббревиатур, имен. Данный индекс должен быть представлен в виде таблицы, содержащей следующие поля: имя файла фрагмента (статьи), заголовок, ключевые слова.

Задание 4.

Анализ использования метафоры в компьютерном журнале должен быть проведен раздельно для статей — научно-технических текстов (задача 1) и текстов рекламы аппаратных и программных средств вычислительной техники (задача 2). Результаты анализа должны быть сведены в таблицы, поддерживаемые системой FineStyle. Должны быть использованы в качестве метафорической картины мира модель Словаря метафор информационных технологий, предметной — рубрикатор справочника “Кто есть кто на компьютерном рынке России”, выпускаемом фирмой SK Communications International совместно с журналом PC Magazine / Russian Edition (см. список литературы). В отчетных материалах обнаруженные метафоры должны быть приведены в контексте предложения. Для каждой метафоры следует привести прямое и переносное значения (толкования), а также ассоциативные поля из ассоциативных словарей.

Задача 1. Должны быть проанализированы научно-технические тексты (статьи журнала) с целью выявления в них примеров использования метафор.

Задача 2. Должны быть проанализированы рекламные тексты с целью выявления в них примеров использования метафор.

Задание 5.

Грамматический словарь: а) должен включать слова, встретившиеся в текстовых фрагментах и относящиеся к следующим грамматическим классам: существительные, прилагательные, глаголы; б) может включать слова — наречия, числительные; в) возможно также составление полного грамматического словаря, включающего слова не только перечисленных грамматических классов, но и предлоги, междометия, союзы, частицы и местоимения. В грамматический словарь не должны включаться имена собственные, аббревиатуры, идентификаторы (слова, содержащие буквы и цифры). Грамматический словарь должен иметь следующую структуру словарной статьи:

<ЛЕММА> <МИ> {s} [S]

<СЛОВОФОРМА1> <МИ1> [i1]

<СЛОВОФОРМА2> <МИ2> [i2]

...

<СЛОВОФОРМАk> <МИk> [ik]

Здесь: ЛЕММА — слово в основной форме; МИ — морфологическая информация о слове (грамматический класс, подкласс); МИj — подробная грамматическая информация); s — количество словоформ в тексте; S — общее количество словоформ в тексте; ij — частота j-ой словоформы.

Общее количество слов в словаре не должно быть меньше 100.

Задание 6.

Конкорданс ЕЯ описания ПО должен быть составлен для понятий предметного указателя, составленного при решении третьей задачи курсовой работы.

При составлении конкорданса рекомендуется предварительно из списка понятий, вошедших в предметный указатель, выделить устойчивые словосочетания и составить “словарь словосочетаний”, имеющий следующую структуру словарной статьи:

<ЛЕММА>

(СЛОВОСОЧЕТАНИЕ1),

(СЛОВОСОЧЕТАНИЕ2),

...

(СЛОВОСОЧЕТАНИЕk).

Здесь: ЛЕММА — слово в основной форме из грамматического словаря, предметного указателя; СЛОВОСОЧЕТАНИЕ — двух–, трехсловное словосочетание из предметного указателя, являющееся термином или основным понятием ЕЯ описания ПО.

Конкорданс ЕЯ описания ПО должен быть представлен в виде “словаря контекстов”, имеющего следующую структуру словарной статьи:

<ЛЕММА/ СЛОВОСОЧЕТАНИЕ> <КОНТЕКСТ> <АДРЕС>.

Здесь: КОНТЕКСТ — ближайшее “окружение” словоформы или словосочетания, размер которого может быть выбран произвольно, однако в большинстве случаев его следует ограничить предложением (количество контекстов для одной леммы должно быть от трех до пяти, а для словосочетания достаточно одного – двух);

АДРЕС — указание на источник контекста — фрагмент текста (статья).

Задание 7.

Перед составлением словаря определений необходимо разработать структуру словарной статьи и описать ее формально в виде графа, таблицы или на языке Бекуса-Наура.

Словарная статья словаря определений терминов ПО должна включать следующие сведения: заголовочное слово (понятие из предметного указателя), варианты определений (толкований), устойчивые словосочетания (из "словаря словосочетаний") и 2–3 эксцерпции (примеры контекстов из текстов ЕЯ описания ПО с указанием их источника из конкорданса).