Выбор группировочного признака зависит от целей исследования. Социологическая информация может быть сгруппирована по:
· номинальному признаку (род занятий, национальность и т.д.);
· признакам, соответствующим ранговым шкалам (например, по характеру труда: ручной труд, работа с механизмами, наладка станков, интеллектуальный труд);
· количественному признаку (группы характеризуются числовым значением, они качественно сравнимы между собой, например группировка по возрастным интервалам: 18—20 лет, 21—25 лет, 26—30 лет и т.д.).
При работе с номинальными и ранжированными группами используются приемы математики, а группы, распределенные по количественному признаку, изучаются с помощью математической статистики.
Группировки бывают разных видов. Простая группировка - это классификация или упорядочение данных по одному признаку. Связывание фактов в систему осуществляется здесь в соответствии с описательной гипотезой относительно ведущего признака группировки (или признака классификации). Так, в зависимости от гипотез можно сгруппировать выборочную совокупность по возрасту, полу, роду занятий, образованию, по высказанным суждениям и т.д. Перекрестная (комбинированной) группировка используется, если опрашиваемых необходимо сгруппировать по двум или более признакам (например, по полу, возрасту и образованию), Она может быть структурной, типологической, аналитической — все зависит от решаемых в ходе исследования задач. Структурная группировка применяется при обобщении опрашиваемых по какому-либо признаку, присущему всей изучаемой совокупности, например, при установлении возрастного состава опрашиваемых. Если же необходимо выделить из респондентов группы соответствующие типы, тогда осуществляется типологическая группировка. Аналитическая группировка производится по двум и более признакам и служит для выявления их взаимосвязи. Если нужно проверить, имеется ли связь между интересом к вопросам нравственного воспитания и чтением литературы (газет, журналов, монографий по данной проблеме), то группировку следует сделать по этим двум признакам.
В социологическом исследовании, как правило, выделяется не одна, а несколько групп респондентов (по возрасту, образованию, месту проживания и т.п.). Каждой группе соответствует некоторое выделенное число, которое характеризует количественный состав группы. Такой ряд чисел, получаемый в результате группировки, социологи называют рядом распределения. Ряд распределения называется вариационным. Например, построим вариационный ряд, отражающий распределение по стажу работы.
Стаж работы (х) | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Число рабочих (n) | 9 | 16 | 37 | 73 | 102 | 83 | 65 | 56 | 49 | 36 |
Объем совокупности составляет 526 |
Приведенный вариационный ряд можно преобразовать в интервальный вариационный ряд.
Стаж работы (х) | До 2 | 2-4 | 4-6 | 6-8 | 8-10 | 10 и более |
Число рабочих (n) | 9 | 53 | 180 | 148 | 105 | 31 |
Объем совокупности составляет 526 |
Часто в социологических исследованиях используют динамические ряды (временные ряды, ряды динамики), представляющие собой изменения значения признака по годам (месяцам). Например, можно построить ряд динамики на основе следующих данных:
Год | 1960 | 1970 | 1980 | 1985 | 1986 | 1987 |
Количество кинопосещений | 3611 | 4652 | 4259 | 4100 | 3882 | 3222 |
Как видно, сначала число кинопосещений росло, затем — неуклонно снижалось. Динамический ряд не указывает причины событий, однако дает некоторое представление о процессе и побуждает к поиску причинно-следственных связей.
Статистические таблицы представляют собой группировку и распределение обследованных индивидов по двум или более признакам. Один из них является подлежащим, другой — сказуемым. Анализ таблиц дает некоторое представление о причинно-следственных связях, т.е. показывает, как изменение одного признака сопровождается изменениями другого (других). Таблицы (таблицы сопряженности) имеют следующий вид:
X | Y | Итого | |
1 | 0 | ||
1 | a | b | a+b |
0 | c | d | c+d |
Итого | a+c | b+d | a+b+c+d |
буквы в клетках обозначают соответствующие частоты
Предположим, что мы имеем два признака признака – пол (1 – мужчина, 0 – женщина) и курение (1 – курит, 0 – не курит).
Курение | Пол | Итого | |
м | ж | ||
Курит | 80 | 4 | 84 |
Не курит | 10 | 6 | 16 |
Итого | 90 | 10 | 100 |
Данные таблицы говорят о том, что в нашей совокупности имеется 90 мужчин, из которых 80 человек курят, и 10 женщин, среди которых 4 человека курящих и т.д.
Ряды распределения и подсчитанные на их основе средние арифметические величины, а также ряды динамики позволяют описать социальное явление, событие, процесс, но не дают возможности выяснить причины. А вот на основе анализа статистических таблиц можно составить некоторое представление о при
чинно-следственных связях, поскольку таблица показывает, как с изменением одного признака изменяется другой.Ответ на вопрос о причинно-следственных связях дают такие методы математической статистики, как корреляционный, дисперсионный, факторный анализ и др.
Для анализа и наглядного представления полученных данных также используются графические методы — полигоны, гистограммы; секторные, круговые, ленточные и другие диаграммы.
Самый распространенный метод графического представления одномерных распределений - это гистограмма, или столбиковая диаграмма. Каждый столбик соответствует интервалу значений переменной, причем его середина совмещается с серединой данного интервала. Высота столбика отражает частоту (абсолютную или относительную) попадания наблюдавшихся значений переменной в определенный интервал. Если просто соединить между собой точки, соответствующие абсолютным или относительным частотам (ось ординат) для середин интервалов, мы получим так называемый полигон распределения.
Пусть, например, вопрос в используемой социологом анкете звучит: “Какова Ваша профессия?” и сопровождается 5-ю вариантами ответов, закодированных числами от 1 до 5. Тогда частотное распределение - будет иметь, например, вид:
Пример одномерной частотной таблицы
Значение признака | 1 | 2 | 3 | 4 | 5 |
Частота встречаемости (%) | 20 | 15 | 25 | 10 | 30 |
То же частотное распределение можно выразить по-другому, в виде диаграммы (гистограммы) вида, отраженного на рис. 1 или в виде т.н. полигона распределения, рис.2.
Рис.1. Диаграмма распределения, рассчитанная на основе таблицы 1.
Рис. 2. Полигон распределения, рассчитанный на основе таблицы 1.
Еще один популярный способ графического представления - это круговая диаграмма. Каждый сектор круговой диаграммы представляет дискретную категорию переменной. Величина сектора пропорциональна частоте категории для данной выборки. На рисунке 3 приведена круговая диаграмма, иллюстрирующая распределение ответов респондентов на вопрос «Как Вам кажется, жизнь в нашей стране в последнее время становится более безопасной или более безопасной».