Методика анализа содержания текстов (стр. 5 из 10)

Конечно, у изобразительного ряда есть свои возможности выржать чувства, вызывать оценки, достаточно однозначные у всей аудитории. Вспомним хрестоматийный киноведческий пример, когда изображение актера Мозжухина в кинокадре с тарелкой супа и то же изображение актера с гробом интерпретируется аудиторией по-разному: в одном случае актер воспринимается как комик, в другом - как трагик. Но для анализа содержания это слишком тонкие материи.

Чаще всего изобразительный ряд в СМК - на телевидении - живет по другим законам. Там он чаще всего (и тут могут быть проведены параллели между фото в газете) активно интерпретируется. Телекоммуникатор (в любой ипостаси - диктора, ведущего, репортера и т.п.) как раз старается снабдить визуальный ряд оценками, своими качествами. И вот уже в этом может быть обнаружено поле деятельности и для аналитика содержания. Не оказывается ли изображение и словесный комментарий к нему в конфликтном положении?

Хочется привести пример одного исследования влияния подписей под фотографиями на восприятие этих фотографий (аналогия с видеорядом и словесным комментарием к нему полная). В результате исследования автор получил такой набор возможностей сочетания характера подписи и самой фотографии:

1. Подпись значительно влияет на интерпретацию снимка, она может сформировать интерпретацию аудитории, коренным образом отличную от явного содержания снимка.

2. Именно содержание подписи может повлиять на то, чтобы интерпретация снимка произошла в нужном автору подписи направлении.

3. Иногда подпись вызывает реакцию реципиента, прямо противоположную той, которую вызывала своим содержанием фотография; если подпись предполагает в содержании фото смысл, несовместимый с его истинным содержанием, то она, как правило, игнорируется и интерпретация зрителя ориентируется только на снимок [13].

Проблема эта чрезвычайно интересная и разработка ее применительно к телевидению кажется весьма плодотворной.

Вообще контент-анализ телевизионных материалов помимо обозначенных проблем имеет и организационные проблемы, связанные с мимолетностью существования этой продукции в эфире. Как правило, если исследование оперирует большим числом переменных, не обойтись без предварительной консервации материала и неоднократного его прокручивания. Иногда исследование осуществляется непосредственно с эфира. Тогда непременным условием становится просмотр материала несколькими кодировщиками, обязательное протоколирование (хотя бы схематичное) эфира, и все равно количество характеристик, которые могут быть уловлены, уменьшается на порядки...

Таким образом, схематически процесс использования контент-анализа в конкретном эмпирическом социологическом исследовании можно представить так: формулировка задач исследования, определяющих выбор единиц наблюдения и разработку категорий анализа; операционализация последних, осуществляемая в инструкции кодировщику; перевод анализируемого текста в совокупность единиц анализа, подвергаемую счету; представление частотного распределения переменных; статистическая обработка и интерпретация результатов. Часть этого пути мы уже прошли.

Машинный способ анализа текста

Далее мы коснемся возможностей машинной обработки материалов способом контент-анализа. Из всех возможностей контент-анализа, которые суммированы в группах 1 и 2, ЭВМ можно поручить задачи анализа текстов, когда в качестве единицы анализа выступает слово. Когда мы говорим, что речь идет о достаточно ограниченном наборе слов, мы имеем в виду ограниченность с точки зрения человеческого мышления. Память же компьютера оперирует списком, состоящим из тысяч слов. Когда мы проверяем орфографию напечатанного текста, происходит операция сличения вашего текста с набором слов, уже введенных в память компьютера. И человеку, выступающему тут в качестве «машиниста», кажется, что число таких слов, введенных в память, беспредельно. Тем не менее оно «конечно», и машинный анализ текста возможен, когда в память ЭВМ заложены эти тысячи слов.

И тогда машина при обработке текстов ничем иным не занимается, как подсчитывает число материалов, где встречаются те слова, которые интересуют исследователя.

Такие операции находят все большее применение и предложениями - провести такой анализ - уже пестрят рекламные странички профессиональных журналов. Дело тут за малым: предусмотреть, например, возможности синонимического ряда понятий...

Более сложные случаи, когда речь идет о генерализации вывода, не обеспеченного симметричным рядом известных слов, пока неподвластны компьютеру, и на этот счет иллюзий пока питать не следует. Другое дело, что компьютер может выступать как машинописный лист фиксации результатов, к которым приходит кодировщик текста. Но и тут существует соображение контроля за этим выводом. Думается, что возможности предъявления такого анализа для контроля пока сдерживают применение компьютера в этом качестве.

Но вспомним, как все это начиналось. Группа ученых Гарвардского университета в США (рук. Ф. Стоун) в 1961 г. начала разработку принципов подобной машинной обработки, проведя серию анализов самых различных текстов: газет, сочинений членов малых групп, программных речей, произнесенных кандидатами на президентский пост от демократической и республиканской партий США, личных документов (писем, дневников, автобиографий) [14].

В рамках этого исследования было разработано несколько программ со следующими общими требованиями: компьютер отыскивает в тексте лингвистические аналоги тем категориям, которые интересуют и оговорены исследователем; подсчитывает частоту употребления этих категорий и их сочетания; выводит результаты в таблицы распределений; группирует текст в зависимости от употребляющихся там категорий и т.д.

Эти операции компьютер осуществлял только после того, как в его память были заложены языковые знаки (слова, идиомы, фразы), которые в своих группировках могут быть выражены на понятийном языке социальной теории исследователя и каждая из которых представляет из себя определенную переменную величину в его гипотезах. Для этого исследователь составляет словарь своего исследования: понятийному слову в качестве его расшифровки даны «носители» его смысла в бытующем в реальности языке.

Построение такого словаря аналогично построению «тезауруса» — языка определенной области человеческого знания, когда ключевым словам из этой области знаний соответствует синонимический ряд общеупотребительных слов. Таким образом, словарная статья в «тезаурусе» - это более крупный семантический блок, чем словарная статья обычного толкового словаря.

Обозреваемое нами комплексное исследование включает следующие самостоятельные анализы.

Исследование Д. Данфи связано с изучением малых групп, оно основано на анализе вербального поведения членов малых групп. Целью этого изучения было выяснение ролевых различий в группах, связей, отношения к фигуре формального наставника - все это во временном развитии. Материалом для анализа были сочинения испытуемых групп. Основными категориями были самоотождествление, величина группы, служащей для испытуемых референтной, действия и эмоции, институциональный контекст и т.д.

Группа исследований была связана с политическими текстами, в частности, анализ М. Смитом, Ф. Стоуном и Е. Гленн программных речей, произнесенных кандидатами на президентский пост от демократической и республиканской партии США в течение 36 лет (от Смита и Гувера до Джонсона и Голдуотера).

Исследователи Дж. Нейменвирс и Т. Брейер провели анализ статей, опубликованных в газетах The Times (Англия), Le Monde (Франция), Frankfurtur Allgieine Zeitung (тогда еще Западная Германия), The New York Times (США), на предмет того, как, по их мнению, обстоит дело с политической интеграцией западных стран в связи с существованием экономических и военных союзов между ними.

Процесс межгосударственной интеграции понимался как изменение следующих четырех элементов: характер принятия решений, касающихся судеб различных стран; обмен между странами почтой, студентами; торговля, иммиграция; мнения масс и элиты по поводу перспектив на этот счет. Показателями изменений в ориентации анализируемых престижных газет были выбраны внимание к национальным и региональным символам и степень тождественности в ориентации газет всех четырех стран.

Даниэл М. Огилви построил специальный словарь для проверки гипотезы о существовании так называемого «комплекса Икара», психологического явления, которое отмечалось по наблюдениям психологов за рядом своих пациентов. Огилви решил подвергнуть испытанию эту гипотезу, проанализировав текстовые материалы, созданные в рамках разных культур. В качестве такого материала были выбраны сказки - 626 сказок из 44 примитивных сообществ. Контент-анализ этих сказок был предварен созданием так называемого «Икарианского словаря», охватывающего 74 категории и 2500 слов, их наполняющих. Для разработки системы категорий использовались разные источники: работы исследователей, описывающих комплекс Икара, истории жизни людей, явно обладавших этим комплексом, тексту наблюдений за ними психотерапевтов и т.д.

Поскольку изначально комплекс Икара определялся как направленность на «полет, падение, огонь, воду, бессмертие и нарциссизм»,, гипотезу о существовании комплекса на уровне анализируемых сказок можно было, по мнению автора, считать доказанной, если эти темы окажутся «связанными» в конкретных единицах фольклора, или на определенном этапе окажется возможным по одним темам предсказать появление в анализируемом тексте смежных тем. Итог анализа состоял в расчете корреляций между 74 категориями и факторном анализе конечной матрицы.

С самых первых попыток использования электронно-счетных устройств для работы с текстом становились ясными преимущества и недостатки обработки текстового материала с помощью машин - они обеспечивали адекватность анализа огромных текстовых материалов, но требовали огромных усилий по составлению программы - собственно «словника», с учетом всех синонимических вариантов понятий, которые надо будет отыскивать в этом море пропускаемых через машину слов. Не случайно, что многие из тех анализов, которые были проделаны в Гарвардском университете, использовали категориальный аппарат ранее проделанных исследований и «обкатывали» его на компьютерах.