9–11 | 12–14 | 15–17 | 18–20 | 21–23 | 5–7 | 8–10 | 11–13 | 14–16 | 17–19 | 20–22 |
Рис. 24. Полигоны распределения частот
(источник: по материалам [36])
Для того чтобы подробнее выразить тенденции распределения, количественно используются три вида показателей: средняя, мода, медиана.
1. Мода (Мо) – это самый простой из всех трёх показателей. Она соответствует либо наиболее частому значению, либо среднему значению класса с наибольшей частотой.
Мода используется редко и главным образом для того, чтобы дать общее представление о распределении. В некоторых случаях у распределения могут быть две моды; тогда говорят о бимодальном распределении (рис. 25). Такая картина указывает на то, что в данной совокупности имеются две относительно самостоятельные группы.
Рис. 25. Бимодальное распределение
(источник: по материалам [36])
2. Медиана (Me) соответствует центральному значению в последовательном (ранжированном) ряду всех полученных значений. В случае если число данных n, четное, медиана равна средней арифметической между значениями, находящимися в ряду на n/2-м и n/2+1-м местах.
3. Средняя арифметическая (М) (далее просто «средняя») – это наиболее часто используемый показатель центральной тенденции. Её применяют, в частности, в расчётах, необходимых для описания распределения и для его дальнейшего анализа. Её вычисляют, разделив сумму всех значений данных на число этих данных.
Ещё одним показателем, который можно использовать в описательной статистике опросов-тестов, является величина разброса. Чаще всего для оценки разброса определяют отклонение каждого из полученных значений от средней, обозначаемое буквой d,а затем вычисляют среднюю арифметическую всех этих отклонений. Чем она больше, тем больше разброс данных и тем более разнородна выборка. Напротив, если эта средняя невелика, то данные больше сконцентрированы относительно их среднего значения и выборка более однородна. Первый показатель, используемый для оценки разброса, – это среднее отклонение
. Его вычисляют следующим образом. Собрав все данные и расположив их в ряд, находят среднюю арифметическую для выборки. Затем вычисляют отклонения каждого значения от средней и суммируют их: = . (6)Поскольку стандартное отклонение всегда соответствует одному и тому же проценту результатов, укладывающихся в его пределах вокруг средней, можно утверждать, что при любой форме кривой нормального распределения та доля её площади, которая ограничена (с обеих сторон) стандартным отклонением, всегда одинакова и соответствует одной и той же доле всей популяции.
Описательная статистика позволяет продемонстрировать, как можно представить графически и оценить количественно степень разброса данных в том или ином распределении. Тем самым можно понять, чем различаются распределения для контрольной группы до и после воздействия. Однако можно ли о чём-то судить по этой разнице – отражает ли она действительность или же это просто артефакт, связанный со слишком малым объёмом выборки? Тот же вопрос встаёт и в отношении экспериментальной группы, подвергнутой воздействию независимой переменной. В этой группе стандартное отклонение для фона и после воздействия тоже различается примерно. Разница между средними показывает достоверность в данных, позволяет ответить на вопрос о возможности опираться на эти результаты и распространять их на всю выборку. На все эти вопросы и пытается дать ответ: индуктивная ли описательная статистика.
Массовая экспресс-диагностика. Здесь не исключены ошибки в индивидуальных случаях, диагноз и прогноз даются лишь с вероятностной точностью [36].
Эти приёмы позволяют проверить, «работает» ли тест в целом и, если он плохо дифференцирует испытуемых, в каких своих частях (заданиях, вопросах) тест «не срабатывает». Применение этих приёмов полезно и необходимо не только при разработке новых тестов, но и при всяком изменении диагностической ситуации в применении старого теста, при переносе теста с одной популяции (на которой установлены тестовые нормы) на другую. Это, прежде всего, относится к техникам самоотчёта и, в частности, к тест-опросникам, полностью зависящим от того, как конкретный испытуемый интерпретирует семантику вопросов и связывает её с субъективной гипотезой о цели обследования.
В социальном маркетинге широко применяются разного рода опросы и тесты. Тест-опросник состоит, как правило, из так называемых ли-вопросов, или «да-нет»-вопросов: каждый вопрос содержит утверждение, с которым испытуемому предлагается соглашаться или не соглашаться. В результате ответ испытуемого кодируется как дихотомическая переменная со значениями «+1» («верно») и «-1» («неверно»). Балл теста подсчитывается суммированием ответов «верно» на «прямые» пункты теста (это вопросы, позитивно связанные с измеряемой чертой) и ответов «неверно» на «обратные» пункты (вопросы, негативно связанные с измеряемой чертой).
Алгебраически такой простейший способ подсчёта тестового балла может быть описан формулой:
, (7) где Хik – балл i-го испытуемого по k-й шкале (черте); Rij – ответ i-го испытуемого на j-й пункт тест-опросника; Cjk – ключ (шкальное значение) j-го пункта по k-й шкале; m – количество пунктов в k-й шкале (для которых Сjk = 0).Обычно Rij = {-1,+1} и Cjk={-1, 0, +1}.
Чтобы как-то минимизировать и без того большие погрешности тест-опросника, необходимо понимать психологический смысл этой процедуры. Пункт тест-опросника должен являться эмпирическим индикатором диагностического концепта – личностной черты. Некорректные вопросы следует исключать из перечня.
Прежде чем применить какой-то тест-опросник на особом контингенте лиц, необходимо постараться взглянуть на каждый вопрос глазами испытуемого. Это требует немалой профессиональной интуиции. При наличии большинства вопросов добиться полной имитации ответов испытуемых не удаётся. В данных случаях применяют эмпирико-статистиче-ский анализ пунктов (в зарубежной тестологии утвердился особый термин – «item analysis»).
В настоящее время без применения этого аппарата не обходится ни одна серьёзная попытка конструирования или адаптации тестов и опросов.
Аппарат эмпирико-статистического анализа пунктов открывает возможность для приспосабливания методики к конкретным условиям её применения. Эта возможность состоит в модификации шкальных ключей для отдельных пунктов (значений Сjk). Обычная архаическая доизмерительная стратегия такого приспособления состоит в том, что опросчик переформулирует сам вопрос в случае его некорректности в рассматриваемой ситуации. Таким образом, перечень вопросов изменяется. Результаты, полученные от респондентов из крупных и небольших городов, оказываются несопоставимыми [36].
Противоположная тактика состоит в том, чтобы перечень вопросов оставлять неизменным, но в разных случаях пользоваться разными векторами шкальных ключей <С>. (Во всех случаях задаются оба вопроса. Этот подход позволяет соединить две задачи конструирования теста: отбор информативных признаков и построение шкалы (уточнение градуального Cjk). При этом неккоректный вопрос будет иметь Сjk = 0.0 в маленьком городе (где k – шкала «тревожности») и, наоборот, Сjk = +1.0 в большом.
Эмпирически устанавливать значения Сjk в отсутствии компьютера, помогает простейший метод.
Алгоритм четырехклеточной корреляции [2].
Идеи этого алгоритма в разнообразных модификациях использовались во множестве работ зарубежных и отечественных авторов. В ситуации, возникающей в отсутствие внешнего критерия валидности, имеется тест-опросник, ориентированный на измерение какой-то одной личностной черты (одномерный опросник) и содержащий М вопросов. Об опрашиваемом контингенте не имеется никакой априорной эмпирической информации, предполагается, что индивиды в этой выборке значимо отличаются между собой по степени выраженности рассматриваемой черты k. Опросчик хочет приспособить тест-опросник к измерению черты k на данном контингенте с помощью уточнения шкальных ключей Cjk. Для этого ему целесообразно взять для предварительного исследования случайную выборку из N индивидов.
На сформированной выборке экспериментатор проводит обследование и получает массив результатов в виде прямоугольной матрицы размерностью N×М, где по строкам испытуемые, по столбцам – пункты, на пересечении – значения Rij ответов i-го испытуемого на j-й вопрос тест-опросника.
Для каждого столбца (для каждого пункта) экспериментатор на основании исходных предположений назначает С0jk – исходные шкальные ключи. Затем для каждой строки (каждого испытуемого) матрицы |R| по формуле (8) подсчитывается суммарный тестовый балл Хik. Среди всех {X} отыскивают 30 % испытуемых с наибольшими значениями тестового балла и 30 % – с наименьшими. Они включаются соответственно в «высокую» и «низкую» экстремальную группы. В дальнейшем по каждому пункту учитываются только ответы испытуемых из экстремальных групп. Шкальные ключи Сjk уточняются с помощью расчёта четырехклеточной корреляции между ответами на пункт и попаданием в экстремальную группу. Для каждого пункта строится матрица сопряжённости 2×2 (рис. 26):