Методика анализа содержания текстов (стр. 7 из 10)

Понятно, что для аналитика содержания такая возможность отпадает. Всякий раз исследователь начинает с «белого листа». Ему как раз и надо знать распределение характеристик текста - это не те достаточно постоянные характеристики населения, как пол, возраст, и прочие, которые нужны при определении выборки в исследованиях аудитории. Действительно, они для определенного региона могут считаться постоянными. Для больших совокупностей людей меняются мало, а если меняются, то эти изменения тут же становятся известными соответствующим статистическим органам, поскольку это их работа, которая заканчивается тем, что они сразу же информируют социум об этих изменениях.

Существуют и другие выборки в классе репрезентативных - это вероятностные, или случайные выборки. Их построение основывается на том факте, что если для каждой единицы генеральной совокупности, например, населения всей страны, будет выдерживаться равновероятная возможность попасть в число отобранных для исследования, т.е. конкретных людей будут отбирать случайным образом, то такая выборка будет отвечать высшему критерию представительности - она будет репрезентативна для всего населения страны.

Мы повели разговор о репрезентативной выборке, а именно о ней идет речь, когда встает вопрос, в какой мере выводы исследования по ряду случаев приложимы (характерны, репрезентативны) ко всему явлению в целом, идя на поводу у неискушенного исследователя-аналитика. Репрезентативная выборка представляет лишь один из двух типов выборок, которыми практически (в принципе) исчерпываются все случаи выборок в социальных исследованиях. Другой класс выборок - типологическая выборка - в ходе исследования говорит нам, что наблюдаемое нами в обществе явление есть, оно при этом имеет определенные, зафиксированные в ходе нашего исследования характеристики (хотя может этими характеристиками и не исчерпываться).

Говоря о репрезентативных выборках, мы остановились на том, что один из подвидов их - и только он один - применим в контент-аналитических исследованиях.

Но здесь вероятностная, или случайная выборка - а это как раз тот самый подвид - приобретает некоторые особенности, с которыми специалист не может не считаться.

В самом деле - в случае с исследованиями общественного мнения мы имеем дело с объектом, протяженным в пространстве, скажем, с населением страны. Как ни сложно оперировать с таким объектом (или, как говорят социологи, с генеральной совокупностью исходных единиц), социологи, установив определенную ступенчатость отбора для разных характеристик, обеспечивают для каждого человека, входящего в эту генеральную совокупность, искомую равновероятную возможность попасть в выборку.

В случае с исследованиями содержания прессы мы имеем дело с объектом, протяженным во времени. Что тут считать генеральной совокупностью? Всю совокупность текстов с первого дня существования газеты? Десятилетие? Пятилетие? Год? Другими словами - если мы возьмем эмпирическую выборку Гэллапа в 1500 человек за образец и будем строить свою выборку текстов в 1500 единиц (пока отвлечемся от того, что считать тут единицей: это с людьми все ясно, а с текстом, как говорится, возможны варианты - это могут быть отдельные дни/номера газеты целиком или отдельные материалы), то реально мы должны промерить все тексты гигантским циркулем, «шаг» которого будут составлять эти 1500 единиц, от сегодняшнего дня в прошлое. Сделаем пять этих гигантских шагов (или двадцать пять), а потом пойдем в обратном порядке - возьмем в отмеренном пространстве каждую пятую единицу (или двадцать пятую) и получим идеальную случайную выборку.

Но - где остановиться циркулю? В пятой точке или двадцать пятой? Это всегда произвольное решение исследователя. Иначе говоря — определение границ генеральной совокупности, из которой будет произведена выборка - это авторитарное решение исследователя и никто ему этого подсказать не сможет. На его выбор должно влиять одно тактическое соображение - его выборка репрезентативна для всего выбранного временного интервала, но не для отдельного периода внутри этого интервала. Другими словами, если для исследования выбраны 1500 текстов газеты с определенным интервалом внутри периода 1963 - 1966 гг., то результаты будут относиться ко всему этому периоду, но не к маю месяцу 1964 г. (точно так же выбранные случайным образом 1500 опрошенных по России демонстрируют мнение, репрезентативное в целом для России, но не для Красноярского края - такая задача потребует увеличения выборки, при чем все на тех же началах отбора уже по Красноярскому краю).

Каковы должны быть эти временные границы, повторяем, это воля исследователя. Ответ на этот вопрос теснее всего связан с программой исследования, т.е. с его задачами. Ясно, что логика определения этих временных границ должна быть одной для выяснения воздействия текстов на аудиторию, процесса, который по самой своей сути является долговременным, и другой - для снятия картины деятельности источника, которая может быть и одномоментной; одной - когда само исследование замышляется для того, чтобы внести коррективы в сегодняшнюю деятельность источника, но она может быть совершенно другой в случае с историко-сравнительными исследованиями.

Во всех случаях, когда речь идет о долговременном процессе, повышается необходимость репрезентативных выборок со случайным отбором единиц наблюдения. Вспомним исследование, связанное с изучением языка идеологий в мировой прессе (см. с. данной работы). Для анализа брался каждый номер престижных газет нескольких стран, вышедший первого и пятнадцатого числа каждого месяца.

Случайность этого отбора уравнивала источники с точки зрения частоты употребления в них политических символов. Поясним свою мысль - определенная газета могла продемонстрировать первого числа какого-то месяца в данном пятилетии необычную даже для нее «густоту», частоту обращения к политической тематике, но эта же газета пятнадцатого числа другого месяца (в другом пятилетии) по причинам того, давно ушедшего пятилетия, абсолютно не касалась политики: она вышла под лозунгом «день спорта». Но в пределах одного-двух-трех десятилетий, на которые распространялся анализ, любая другая газета могла быть точно в таком же положении в другие первое и пятнадцатое числа.

В этом смысле справедливо замечание, что большой временной отрезок для отбора и сам механизм случайного отбора (а это мог быть каждый второй и шестнадцатый номер газеты и т.п.) уравняли источники и в этом смысле сделали надежными выводы исследования: они были характерны для всего анализируемого периода деятельности источника.

Такой случайный отбор уравнял газеты еще в одном отношении. Известно, что в газетах разных стран существенно разнятся номера в зависимости от дня недельного цикла. Так, например, американские ежедневные газеты имеют различную толщину в разные дни недели. Это зависит в основном от количества рекламы, размещаемой на страницах газет, а она в свою очередь отражает динамику привычек покупателей в течение недели. И тогда выпуски газеты в четверг имеют одну толщину, а субботние - другую. Когда газеты отбираются на большом временном отрезке случайным образом, возрастает вероятность того, что в выборку попадут номера газет разных дней недели.

Когда исследователя интересует современная ему деятельность источника и он хочет ограничиться заведомо небольшим временным периодом для анализа, он должен специально учесть этот фактор. Так, известно, что каждая газета имеет сменные тематические рубрики для каждого дня недели, телевизионные каналы приурочивают особые развлекательные передачи к концу недели и т.д.

Чтобы отразить в выборке недельную цикличность, столь характерную для деятельности СМК, у аналитика содержания есть уже опробованный метод «конструирования» недели (авторы этого метода - Роберт Джоунс и Рой Картер). По этому методу в годичном выпуске газет отмечаются все выпуски в понедельник, вторник и т.д. Затем берется каждый десятый выпуск из числа выпусков в понедельник, каждый десятый выпуск из выпусков во вторник и т.п. Сконструированная таким образом неделя будет репрезентировать весь год, выбранный для анализа. Надо сказать, что этот вывод не голословен: исследователи, рекомендовавшие такой подход к отбору единиц для анализа, в ходе своих сравнительных исследований показывали, что точно такие же результаты получаются, если анализировать весь материал за год сплошь.

Интересный вариант выборки с использованием такой недели содержит исследование Ч. Окигбо (отделение массовых коммуникаций, Университет Нигерии).

После отбора четырех газет - объекта исследований, репрезентирующих разные формы собственности, разные политические направления: частное предприятие, наиболее элитарную газету, государственную собственность/контроль, газету - собственность управления штата -формы, которые, по мысли автора, в значительной мере определяют отбор новостей (механизм отбора новостей был предметом исследования), автор использовал следующий механизм построения выборки. На первом этапе из годичной подшивки каждой газеты за 1986 г. (52 недели) методом случайного отбора была взята одна сплошная неделя для каждой газеты - это была неделя с понедельника 10 марта по понедельник 17 марта 1986 г. Причем, поскольку воскресные номера газет в этой стране скорее напоминают еженедельник (большой объем, множество редакционных материалов и аналитических статей), они были изъяты из анализа. К этим семи номерам была прибавлена сконструированная неделя (случайным образом был отобран понедельник из всех понедельников и т.д.; в итоге в выборку попал понедельник 14 июля, вторник 9 сентября, среда 14 мая, четверг 28 августа, пятница 7 февраля, суббота 26 июля и понедельник 20 октября). Таким образом, исследование было осуществлено на 14 номерах анализируемых газет [17].