Смекни!
smekni.com

Практика выделения ключевых знаков журналистского текста (стр. 2 из 2)

Ключевым словом «с максимальным весом» (по терминологии В. А. Лукина [1]) по результатам анализа смысловой структуры является слово «стена», поскольку оно образует сильную позицию текста (заголовок), является темой (предметом мысли автора) — компонентом ГМ. Кроме того, данное слово — самое частотное в тексте.

Приведем результаты компьютерного анализа частоты слов. Количество слов в тексте — 627. Наиболее частотные слова (Тор-20) приведены в табл. 1.

Мы видим, что тема текста («стена»), отраженная в заглавии — сильной позиции текста, является самым частотным словом. Наименование проблемы («терроризм»), лежащей в основе конфликта, и предикат «не поможет» (заметим, что программа не учитывает служебные слова) — компоненты главной мысли — также включены в двадцатку наиболее частотных слов. Частотное слово «судить» содержится в аналитической оценке ситуации (в выводе — сильной позиции текста). Все констатирующие (5) и некоторые развивающие тезисы (3 из 14) также содержат частотные слова («земля», «друг с другом», «ценность», «религия», «терроризм», «человечество», «общечеловеческий», «человек (люди)»).

Таблица 1

Слово Количество повторений в тексте Доля в тексте, % от общего числа слов
1 Стена 15 2,3
2 Земля 7 1,1
3 Друг (друг друга) 6 0,9
4 Человек 6 0,9
5 Ценность 6 0,9
6 Жизнь 5 0,7
7 Век 5 0,7
8 Террорист 4 0,6
9 Действие 4 0,6
10 Судить 3 0,4
11 Человеческий 3 0,4
12 Израиль 3 0,4
13 Религия 3 0,4
14 Молиться 3 0,4
15 Человечество 3 0,4
16 Терроризм 3 0,4
17 Палестинец 3 0,4
18 Борец 3 0,4
19 Общечеловеческий 3 0,4
20 Помочь 3 0,4

Примечание. Данные получены с помощью программы на сайте istio.com.

Таким образом, частотные слова текста сосредоточены в главной мысли, аналитической оценке ситуации и констатирующих тезисах, что служит еще одним подтверждением их статуса ключевых фраз текста, ведь повтором всегда выделяется элемент, важный для авторского замысла. Часть этих структурных компонентов выделена автором с помощью полужирного шрифта.

Обратимся к результатам психолингвистического эксперимента. Количество респондентов — 42 человека. Экспериментальные задания: 1) выделить ключевые слова текста (не более 10); 2) выделить ГМ и АОС текста. Совокупное количество выделенных в тексте ключевых слов — 292. Наиболее частотные слова, отмеченные респондентами как ключевые для данного текста, представлены в табл. 2 (Тор-20 респондентов).

Сопоставим Тор-20 и Тор-20 респондентов. В Тор-20 содержатся не отмеченные респондентами частотные слова «земля», «век», «действие», «молиться», «палестинец», «борец», «помочь». Показательно, что большая часть данной лексики не входит в состав основных элементов смысловой структуры (ГМ, Кт, АОС) и, таким образом, не является КЗ текста. Вместе с тем в состав Тор-20 не вошли такие слова, как «отсутствие», «трагедия», «(не) меняться», «политика», «единоверец», «прикрытие», несущие значительную смысловую нагрузку и вклю-

Слово Количество повторений в НКС Доля в НКС, % от общего числа слов
1 Ценность 33 11,3
2 Общечеловеческий 26 8,9
3 Стена 18 6,1
4 Жизнь 12 4,1
5 Отсутствие 11 3,7
6 Терроризм 11 3,7
7 Религия 11 3,7
8 Трагедия 9 3
9 Человеческий 7 2,3
10 Друг (друг друга) 6 2
11 Человечество 6 2
12 (Не) меняться 5 1,7
13 Политика 5 1,7
14 Человек (люди) 5 1,7
15 Израиль 4 1,3
16 Судить 4 1,3
17 Террорист 4 1,3
18 Суд 3 1
19 Единоверец 3 1
20 Прикрытие 3 1

Примечания: 1. Данные получены с помощью программы на сайте istio.com. 2. НКС — набор ключевых слов.

ченные в состав ключевых слов респондентами. Все эти слова являются компонентами констатирующих тезисов, т. е. второстепенными КЗ. Что касается лексики, входящей в состав развивающих тезисов, фона и иллюстраций, не образующих КЗ текста, то Тор-20 содержит 9 таких слов, Тор-20 респондентов — 5. Таким образом, лексика, входящая в Тор-20 респондентов, теснее коррелирует с основными элементами смысловой структуры — ключевыми фразами текста.

Наиболее частотным словом текста, как уже отмечалось выше, является слово «стена», а наиболее важным для респондентов оказалось слово «ценность» — второстепенный КЗ по результатам анализа смысловой структуры и доминантный знак по результатам эксперимента. Заметим, что данные количественного компьютерного анализа совпадают с данными Частотного словаря современного русского языка [2], согласно которым слово «стена» имеет большее по сравнению со словом «ценность» число употреблений на 1 млн слов корпуса (ipm). Частота слов в алфавитном списке словаря: «стена» — 261.0 ipm, «ценность» — 81.2 ipm; в разделе «Частотный словарь публицистики» указанного выше словаря: «стена» — 194.4 ipm, «ценность» — 97.5 ipm.

Вместе с тем по результатам эксперимента мы видим, что в интерпретации респондентов смысловой центр текста сместился с главной мысли «стена не поможет избавить мир от терроризма» на третий констатирующий тезис «главная наша трагедия — отсутствие общечеловеческих ценностей», представляющий авторское видение основной причины поднятой в тексте проблемы. Лексика, входящая в состав данного тезиса, в большинстве случаев выделялась респондентами в качестве ключевой, а сам тезис 17 из 42 опрашиваемых отметили как ГМ текста. В то время как собственно ГМ «опознали» только 2 респондента: «Стена — не выход из сложившейся ситуации, она не сможет отгородить страну от терроризма» и «Стена, которую Израиль хочет возвести, чтобы отгородиться от Палестины, не сможет решить проблему терроризма». Но, пожалуй, самое любопытное — формулировки, объединяющие слова «стена» и «ценности» в поле ГМ, предложенные четырьмя респондентами: «Строить стены бесполезно, пока нет общечеловеческих ценностей», «Проблема не в стене, а в отсутствии у людей моральных ценностей» и т. п. 7 респондентов в качестве ГМ выбрали констатирующий тезис «Человечество не меняется, люди не в состоянии ужиться друг с другом». Еще 1 респондент включил в него слово «ценности»: «Люди не могут ужиться друг с другом из-за отсутствия общечеловеческих ценностей». 5 респондентов в качестве ГМ указали АОС текста: «Мы строим стены и судим стены, вместо того чтобы судить себя и прекратить карать других». 3 респондента выбрали информационный повод публикации в качестве ГМ: «В Израиле хотят возвести стену, чтобы отгородиться от террористов». Трое опрашиваемых не определили ГМ. Несмотря на то что эксперимент продемонстрировал очевидную разницу в способности респондентов глубоко понять основной смысл текста, его результаты позволяют получить обратную связь: демонстрируют возможную интерпретационную картину, в данном случае — фиксацию внимания респондентов на концепте «ценности».

Подводя итоги, отметим, что подавляющее число частотной лексики (Тор-20) и лексики, выделенной респондентами в качестве ключевой (Тор-20 респондентов), относится к именам существительным и входит в состав ключевых фраз — основных элементов смысловой структуры текста. Тем самым подтверждается неоднократно высказанное исследователями положение о преобладании существительных в поле ключевых слов и о частотности последних.

Вместе с тем понятия «частотное слово» и «ключевое слово» не являются синонимичными: частотные слова не всегда являются ключевыми. Так, частотные слова «век», «действие» и некоторые другие не могут быть отнесены к числу ключевых по результатам содержательного анализа и эксперимента, поскольку они не несут значительной смысловой нагрузки: не входят в состав основных элементов смысловой структуры и не выделяются респондентами.

Использование комплекса количественных и «качественных» методик определения ключевых знаков текста позволяет выделить разные виды последних. Анализ смысловой структуры текста фиксирует ключевые фразы, на базе которых могут быть выделены ключевые слова. Компьютерный количественный анализ представляет собой удобный механизм определения частотной лексики, которую в сфере поисковой оптимизации называют ключевыми словами текста. Однако его результаты, по сравнению с экспериментальными данными, в меньшей степени коррелируют с результатами содержательного анализа смысловой структуры текста. Анализ данных опроса респондентов приобретает особую важность при дискурсивном подходе, поскольку позволяет уточнить характер ключевых знаков (доминантные/второстепенные) с точки зрения респондентов и получить информацию о том, как аудитория воспринимает определенный текст. Соотнесение результатов нескольких методик дает возможность с высокой степенью точности определить состав и характер ключевых знаков журналистского текста.

Список литературы

Лукин В. А. Художественный текст: Основы лингвистической теории и элементы анализа. М., 1999. 192 с.

Ляшевская О. Н., Шаров С. А. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М., 2009. 1087 с. [Электронный ресурс]. URL: http://dict.ruslang.ru/