Совокупность всех возможных социальных объектов, которые подлежат изучению в пределах программы исследования, называется генеральной совокупностью, а часть объектов генеральной совокупности, отобранная с помощью специальных приемов для получения информации о всей совокупности, — выборочной совокупностью (выборкой).
Свойство выборочной совокупности воспроизводить параметры и значимые элементы структуры генеральной совокупности называется репрезентативностью.
Преимущества выборочного исследования по сравнению со сплошным состоят в том, что оно:
позволяет сократить затраты на сбор и обработку социологической информации;
позволяет добиться большей оперативности;
имеет более широкую область применения;
в ряде случаев позволяет получить более достоверные сведения.
Процесс выборки основан на двух моментах: во-первых, на взаимосвязи и взаимообусловленности качественных характеристик и признаков социальных объектов; во-вторых, на правомерности выводов о целом на основании изучения его части при условии, что по своей структуре эта часть является микромоделью целого.
Единица отбора — это элемент или набор элементов, предназначенный для отбора на определенной ступени выборки.
Единица анализа — элемент выборочной совокупности (респондент), подлежащий изучению.
Переменной называется множество отдельных значений характеристик элементов совокупности; параметром — суммарное описание переменной в данной генеральной совокупности; статистикой — суммарное описание переменной в выборочной совокупности.
Основная цель выборочного метода — выбор элементов из совокупности таким образом, чтобы распределение этих элементов в выборке повторяло их распределение в совокупности. Достижению этой цели служит наиболее распространенная вероятностная (случайная) выборка. Ее модель связана с понятием статистической вероятности, изучаемой во многих отраслях социальных наук (вероятность некоторого ожидаемого события есть отношение числа ожидаемых событий к числу всех возможных).
Самый легкий путь получения случайной выборки — присвоить каждому элементу свой номер, а затем с помощью компьютера рассчитать случайные числа, из которых и берется выборка (например, каждый десятый номер в каждой случайной цепи).
Можно выбирать из генеральной совокупности по какому-то принципу (каждая тысячная фамилия из списка абонентов телефонной сети, каждый третий дом на определенной улице; студенты, родившиеся в сентябре, и т.д.)
Преимущества случайной выборки:
объективность и точность отбора респондентов;
не требуется детальное знание изучаемой совокупности;
использование методов математической вероятности. Недостатки:
сложность процедуры отбора;
затратность ресурсов.
На практике часто применяется метод гнездовой выборки. Он предполагает отбор в качестве единиц анализа не отдельных людей, а группы (семьи, студенческие группы, бригады и т.д.) с последующим сплошным их опросом. Гнездовая выборка будет репрезентативна (представительна) в том случае, если состав групп в максимальной степени близок по основным демографическим признакам респондентов.
В некоторых случаях невозможно использование вероятностных схем отбора, описанных выше. Тогда берется целенаправленная выборка, к которой неприменимы правила теории вероятностей. Она осуществляется с помощью методов стихийной выборки, квот и основного массива.
В случае стихийной выборки невозможно предопределить структуру массива респондентов и, соответственно, трудно определить репрезентативность. Существует несколько разновидностей этого метода:
так называемый отбор «первого встречного». Применим в практике обследований, проводимых средствами массовой информации. Исследователь проводит опрос лиц, которые встретились ему в месте опроса (например, на улице);
отбор «себе подобных». Исследователь подбирает для опроса или наблюдения респондентов из своего окружения (знакомые, коллеги);
отбор «желающих участвовать». Примером может служить почтовый опрос читателей газеты или журнала. При таких опросах решение о включении в выборку принимает сам респондент.
Метод квот является распространенным способом отбора респондентов при массовых опросах общественного мнения. Его используют при наличии до начала исследования статистических данных о контрольных признаках элементов генеральной совокупности. Все данные о том или ином контрольном признаке выступают в качестве квоты. Респонденты отбираются целенаправленно, с соблюдением параметров квот. Число характеристик, данные о которых выбираются в качестве квот, как правило, не превышает четырех. Главная задача для интервьюера заключается в том, чтобы создать условия, близкие к случайному отбору, с равными шансами для каждого элемента генеральной совокупности попасть в выборку.
Метод квот позволяет существенно сократить время и средства, затрачиваемые на опросы. К преимуществам квотной выборки относятся также оперативность и малая трудоемкость.
Недостатки квотной выборки:
требуется детальное знание изучаемой совокупности;
субъективизм интервьюера при отборе респондентов;
ограниченное время посещения респондентов;
уклонение респондентов от опроса;
не позволяет использовать методы математической вероятности.
Метод основного массива применяется в разведывательных исследованиях для уточнения какого-нибудь контрольного вопроса. В таких случаях опрашивается 50—60% потенциальных респондентов. Все рассмотренные методы представляют собой примеры одноступенчатой выборки. Многоступенчатая выборка осуществляется в несколько ступеней: на первой обычно реализуется гнездовая выборка, а потом проводится случайный отбор респондентов в гнездах. Многоступенчатая выборка применяется в крупномасштабных исследованиях, когда в генеральной совокупности насчитываются тысячи и миллионы единиц, размещенных на значительной территории. При построении многоступенчатой выборки используются несколько способов отбора элементов выборочной совокупности. Например, районированный (типический) отбор производится на основе распределения заданного числа отбираемых единиц измерения, т.е. объема выборки, между так называемыми «районами» — группами элементов генеральной совокупности, выделяемыми в соответствии со значениями изучаемого в исследовании заданного «базового признака». Выделяемые таким образом слои будут внутренне однородными, но отличными друг от друга, а взятые вместе — исчерпывать всю совокупность.
В крупномасштабных многоступенчатых выборках требования к точности оценок смещаются на второй план, уступая место вопросам снижения стоимости исследования за счет выбора минимально допустимого числа единиц опроса.
Объем выборки определяется аналитическими задачами исследования, ее репрезентативность — целевой установкой программы. Объем выборки влияет на ошибки репрезентации: чем больше величина выборки, тем меньше возможная ошибка. Для увеличения точности в два раза необходимо увеличить выборку в четыре раза.
Ошибка репрезентации — это различие между характеристиками генеральной и выборочной совокупности. Количество респондентов, включенных в выборочную совокупность, должно составлять 10% от генеральной совокупности, но не превышать 2000—2500 человек (если величина генеральной совокупности 5000 человек и более).
Для пробных опросов достаточна выборочная совокупность объемом 100—250 человек. При массовых опросах, если величина генеральной совокупности составляет менее 5000 человек, достаточный объем выборочной совокупности, гарантирующий достоверные результаты исследования, составляет 500 человек.
Оценка надежности результатов выборочного обследования: при ошибке выборки до 3% — повышенная надежность; 3—10% — обыкновенная; 10—20% — приближенная; 20—40% — ориентировочная; более 40% — прикидочная.
В аналитических и экспериментальных исследованиях проблема репрезентативности выборки является второстепенной в сравнении с необходимостью обеспечить качественное представительство изучаемых объектов.
Качество выборки зависит:
от меры однородности социальных объектов по наиболее существенным характеристикам (чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы);
от степени дробности группировок анализа, планируемых по задачам исследования;
от целесообразного уровня надежности выводов из предпринимаемого исследования.
Традиционно выделяют следующие виды ошибок:
случайные (случайные отклонения выборочных значений параметров);
систематические (ошибки смещения);
погрешности вычислений.
Погрешности вычислений возникают при математико-статистической обработке результатов измерений. О них необходимо помнить при оценке точности и надежности выборочных данных и при интерретации результатов исследования.
Случайные ошибки бывают следствием большого числа разнообразных факторов, учесть действие каждого из которых невозможно. Ошибка выборки считается случайной, а выборочная совокупность репрезентативной, если отклонение не превышает в среднем 5%. Наиболее опасный вид ошибок — систематические, или ошибки смещения. Такие ошибки являются результатом действий в одном направлении определенной группы причин, которую необходимо выявить.
Источниками систематических ошибок могут быть: неверные статистические данные о параметрах контрольных признаков генеральной совокупности; ошибочная модель выборки; неправильное формирование выборочной совокупности; несовершенство инструментария и ошибки в организации сбора данных; неправильная интерпретация результатов первичных измерений и, соответственно, неправильные последующая обработка и анализ информации.