В программе эмпирического исследования тщательно описывается проект выборки, который в последующем может уточняться. В проекте выборки указываются принципы выделения из объекта той совокупности людей, которые впоследствии будут охвачены опросом; обосновывается техника проведения опроса; указываются подходы к определению достоверности полученной информации (чтобы удостовериться в степени правомерности распространения полученных выводов на весь объект исследования).
Репрезентативность - свойство выборочной совокупности представлять основные параметры генеральной совокупности. Если совпадения нет, говорят об ошибке репрезентативности -мере отклонения статистической структуры выборки от структуры соответствующей генеральной совокупности. Предположим, что средний ежемесячный семейный доход пенсионеров в генеральной совокупности составляет 2 тыс. руб., а в выборочной - 6 тыс. руб. Это означает, что социолог опрашивал только зажиточную часть пенсионеров, в его исследование вкралась ошибка репрезентативности. Иными словами, ошибкой репрезентативности называется расхождение между двумя совокупностями - генеральной и выборочной. Последняя выступает и как объект обследования и как средство получения информации о генеральной совокупности.
Наряду с термином «ошибка репрезентативности» в отечественной литературе можно встретить другой - «ошибка выборки». Иногда они употребляются как синонимы, а иногда термин «ошибка выборки» используется как количественно более точное понятие.
Ошибка выборки - отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности. На практике она определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними величинами. В социологии при обследованиях взрослого населения чаще всего используют данные переписей населения, текущего статистического учета, результаты предшествующих опросов. В качестве контрольных параметров обычно применяются социально-демографические признаки. Сравнение средних величин генеральной и выборочной совокупностей, определение на основе этого ошибки выборки и ее уменьшение называется контролированием репрезентативности.
Ошибки выборки подразделяются на два типа - случайные и систематические. Случайная ошибка влечет за собой вероятность того, что выборочная средняя выйдет (или не выйдет) за пределы заданного интервала. К случайным ошибкам относят статистические погрешности, присущие самому выборочному методу. Они уменьшаются при возрастании объема выборочной совокупности.
Второй тип ошибок выборки - систематические ошибки. Если социолог решил узнать мнение всех жителей города о проводимой местными органами власти социальной политике, а опросил только тех, у кого есть телефон, то возникает предумышленное смещение выборки в пользу зажиточных слоев, т.е. систематическая ошибка. Неконтролируемые перекосы в распределении выборочных наблюдений могут быть вызваны: 1) заменой требуемых единиц наблюдения другими, более доступными; 2) неполным охватом выборочной совокупности (недополучение анкет, неполное их заполнение, труднодоступность единиц наблюдения). Систематические ошибки при возрастании объема выборки не уменьшаются.
Систематические ошибки - результат деятельности самого исследователя. Они возникают, когда: 1) выборка не соответствует задачам исследования (социолог решил изучить только работающих пенсионеров, а опросил всех подряд); 2) незнание характера генеральной совокупности (социолог думал, что 70% всех пенсионеров не работает, неработающих оказалось только 10%); 3) отбираются только «выигрышные» элементы генеральной совокупности (например, только обеспеченные пенсионеры). Для исследователя оценить последствия систематической ошибки - задача непростая.
Чтобы избежать ошибки:
· каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку;
· отбор желательно производить из однородных совокупностей;
· надо знать характеристики генеральной совокупности;
· при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.
Если выборочная совокупность (или просто выборка) составлена правильно, то социолог получает надежные результаты, характеризующие всю генеральную совокупность. Если неправильно, то возникшая на этапе составления выборки ошибка возрастает на каждом следующем этапе проведения социологического исследования и достигает в конечном счете такой величины, которая обесценивает проведенное исследование.
Исключив из идеальной генеральной совокупности все труднодоступные единицы наблюдения, мы получим более узкое понятие - реальную генеральную совокупность. В методологической литературе первая получила название концептуального объекта, а вторая - проектируемого.
Концептуальный объект - идеальный конструкт, обозначающий рамки темы исследования. Проектируемый объект - совокупность доступных исследователю единиц.
Итак, взвесив свои возможности и поняв, что всех, кто идеально подходит для нашей генеральной совокупности, мы опросить по разным обстоятельствам не сможем, мы получаем в итоге новую генеральную совокупность, из которой и должны исходить, проектируя свою выборку. Они могут различаться совсем незначительно (если труднодоступных единиц наблюдения мало) или очень значительно (если таковых много).
Поскольку два объекта расходятся, то следует заново переопределить генеральную совокупность. Старое определение: генеральная совокупность - это та совокупность, из которой предполагается производить выборку единиц. Новое определение: генеральная совокупность - это та совокупность, из которой производится выборка единиц. Чем они различаются? Старое определение не учитывает труднодоступность и возможные на практике ограничения, но указывает на теоретически возможный объем понятия, скажем, «россияне». В теоретически сконструированной генеральной совокупности, согласно официальной статистике, например, 49% мужчин и 51% женщин. Но когда социолог отбросил все труднодоступные единицы наблюдения и дал новое определение, приближенное к реальности обследования, у него получилось, к примеру, 43% мужчин и 57% женщин (уменьшение могло произойти за счет того, что, скажем, опросить военных и заключенных накануне президентских выборов практически невозможно или не реально).
Из какой генеральной совокупности - теоретически мыслимой или реально существующей - должен исходить социолог? Видимо, из второй. А с какой генеральной совокупностью он должен сравнивать выборочную после полевого исследования и устанавливать меру отклонения, т.е. определять репрезентативность? Обязательно со второй. Но часто об этом забывают, и сравнение происходит с первой совокупностью, хотя выборка производилась из второй.
Однако трудности встречаются, как мы уже выяснили, не только на пути конструирования генеральной совокупности. Не меньше, если не больше, их и на пути конструирования, а затем и обследования выборочной совокупности. Выше они были сгруппированы в два типа ошибок выборки - случайные и систематические. Для неопытного полевого социолога они могут стать мощнейшим фактором возмущения и причиной серьезных погрешностей.
Для сокращения разрыва между идеальной (проектируемой) и реальной (получившейся) выборками, приведения в соответствие замысла и действительности социологи придумали множество довольно эффективных приемов, например, контроль выборки (увеличение удельного веса недостающих групп и уменьшение избыточных), ремонт выборки (замена труднодоступных респондентов аналогичными по задаваемым признакам индивидами), контроль заполнения вопросников и др. С их помощью реальный массив подгоняется под проектируемый.
Одна из ключевых проблем, встающих, как правило, перед социологом, решающим: доверять полученным в ходе него данным или нет, это то, сколько же человек должно быть опрошено для того, чтобы получить действительно репрезентативную информацию. К сожалению, единой и четкой формулы, используя которую можно было бы рассчитать оптимальный объем выборочной совокупности, не существует в природе. И объясняется это весьма просто. Дело в том, что определение объема выборочной совокупности – это проблема не столько статистическая, сколько содержательная.
Иными словами, объем выборочной совокупности зависит от множества факторов, связанных с проведением исследования: его целей, содержания, методов и, в первую очередь – от следующих:
используемые в исследовании методики сбора первичной информации;
уровень однородности генеральной совокупности;
цели и задачи исследования;
требующаяся точность получаемой информации.
Что касается первого из названных факторов, то его влияние на объем выборки очевидно: чем более точен и надежен метод – тем меньше объем выборочной совокупности. Одно дело, если мы использовали почтовый опрос, другое - личное интервью. Во втором случае мы, естественно, можем остановиться на минимальной границе избранного объема выборки.
Учет при определении объема выборочной совокупности другого из названных факторов также достаточно прост. Дело в том, что генеральная совокупность, из которой выделяется в процессе исследования выборочная, может быть как гетерогенной, т.е. весьма неоднородной (к примеру, мы должны исследовать в отношении некоего товара потребительское поведение всего населения города, среди которого: и мужчины, и женщины; и молодые, и пожилые; и образованные, и малообразованные, и т.п.), так и гомогенной, т.е. достаточно однородной (к примеру, мы изучаем потребительское поведение молодых матерей в отношении памперсов или молодых ребят по поводу оценки различных марок мотоциклов).