Отбор производится с помощью жеребьевки, таблицы (либо генератора) случайных чисел. Главный принцип – случайность, т.е. все единицы генеральной совокупности, имеют равную вероятность попасть в выборочную совокупность.
1. Принцип жеребьевки. Каждый элемент генеральной совокупности заносится на бумажку (это могут быть фамилии, адреса, просто номера (в этом случае выпавшие номера ставят в соответствие с людьми в списках) и т.д.), затем бумажки помещаются в барабан, перемешиваются и не глядя вытаскиваются.
2. Принцип таблицы случайных чисел. Начиная с любого места таблицы, берем четыре следующих друг за другом числа. Эти числа и будут номерами людей в списке, которых следует отобрать в выборку (числа, превышающие численность генеральной совокупности, опускаются) [1, 101].
3. Принцип генератора случайных чисел. Это то же самое, что и таблицы случайных чисел, только числа вырабатываются компьютером (для этого существует специальная программа).
Различают повторную и бесповторную выборку. При повторном отборе каждый выбранный элемент возвращается в ГС. При бесповторном отборе выбранный элемент не возвращается в ГС.
2. Наиболее близкой к собственно случайной выборке является механическая выборка. механический отбор – когда все единицы наблюдаемой совокупности располагают в определенной последовательности (по номерам, по алфавиту и т.д.), единицы выбирают через определенный промежуток;
Механическая выборка всегда бесповторная, так как объем генеральной совокупности задан (или его можно рассчитать, используя имеющиеся данные о пропорции единиц генеральной т выборочной совокупностей). Проведение механической выборки требует список характеристик респондентов (фамилии, адреса, телефоны и т.д.). Из этого списка через равные промежутки люди отбираются в выборку. Этот промежуток называется шагом выборки.
[3, 19], гдеN – объем генеральной совокупности
n – объем выборочной совокупности.
Начало отбора выбирается случайным образом в пределах шага выборки. Например, если шаг выборки равен 20, то начинать отбор надо с любого числа от 1 до 20.
Поэтому на практике систематический отбор считают эквивалентным случайному, если порядок расположения элементов в списке никак не связан с исследуемыми переменными. По сравнению со случайной выборкой систематический отбор часто позволяет с большей точностью оценивать средние значения исходной совокупности. Однако следует иметь в виду, что систематический отбор дает удовлетворительные результаты только в том случае, если в списках отсутствует цикличность, связанная с интервалом отбора, или др. тенденции, способные оказывать систематическое влияние на результат.
3. гнездовой отбор – производится в том случае, если для изучения берут не отдельные единицы совокупности, а отдельные группы единиц или гнезда.
Вид выбора, при котором отбираемые объекты представляют собой группы или гнезда (кластеры) более мелких единиц. Раньше понятие гнезда распространялось только на двухступенчатую выборку, отобранные на первой ступени объекты рассматривались как серии элементарных единиц, которые подвергались сплошному обследованию. Сейчас этот вид отбора сохранил за собой название серийного, а понятие гнезда расширилось на случаи выборки многоступенчатой. Гнездом называют единицу отбора высшей ступени, состоящую из более мелких единиц низшей ступени. В выборку могут быть включены как все единицы низшего уровня, так и их часть. Число единиц образующих гнездо, называют его размером. Гнездовой отбор обладает большими организационными преимуществами перед отбором единиц. Значительно проще осуществить отбор и обследование нескольких компактных групп, чем десятков или сотен отдельных единиц. Технические преимущества гнездового отбора особенно ощутимы при построении территориальной выборки. Отбор небольшого числа территориальных сегментов (населенных пунктов, районов, жилых кварталов и т. д.), затем выборочный или сплошной опрос проживающего в них населения существенно уменьшают стоимость исследования и сроки его проведения. Основные рекомендации при выборе гнезд сводятся к тому, чтобы различия между гнездами были минимальными, а составляющие их единицы были бы по возможности более неоднородными. Это правило прямо противоположно основному принципу расслоения, в соответствии с которым выигрыш в точности тем больше, чем более однородными будут выделенные слои. Другая рекомендация касается выбора размера гнезд: большое число малых гнезд предпочтительнее малого числа крупных. Гнездовая выборка являясь удобной и экономичной формой отбора, не означает отступления от принципа случайности. Для отбора равноразмерных гнезд применима любая схема простого случайного отбора или систематичного отбора. Если гнезда сильно различаются по размеру, то выполняют предварительное расслоение совокупности гнезд по размеру с последующим извлечением выборки из каждого слоя. Другая распространенная форма выбора гнезд - отбор с вероятностью, пропорциональной размеру. Особенно он эффективен в случаях, когда из большого числа гнезд самого разного размера необходимо отобрать незначительное число при наличии других факторов расслоения.
4. типический отбор – это вероятностная выборка, обеспечивающая равномерное представительство в выборочной совокупности различных частей (типов) явлений. Существует несколько этапов в проведении типической выборки:
- первоначальная (или генеральная) совокупность разбивается на 2 и более подгруппы по какому-либо признаку (например, по полу);
- определяется число подлежащих наблюдению единиц в каждой группе. При этом используется пропорциональное и непропорциональное размещение. При пропорциональном размещении количество отбираемых в каждую группу единиц пропорционально удельному весу данной группы в генеральной совокупности. При непропорциональном размещении из каждой группы отбирают одинаковое число единиц.
5. комбинированный отбор – на практике часто применяют комбинированный отбор, при котором сочетаются указанные выше способы. Например, разбивают генеральную совокупность на серии одинакового объема, затем простым случайным отбором выбирают несколько серий и, наконец, из каждой серии простым случайным отбором извлекают отдельные объекты.
В экономико-статистических исследованиях используют следующие способы отбора единиц из генеральной совокупности:
1. индивидуальный отбор – в выборку отбираются отдельные единицы;
2. групповой отбор – в выборку попадаются качественно однородные группы или серии изучаемых явлений;
3. комбинированный отбор – как комбинация индивидуального и группового отбора.
В зависимости от способа отбора единиц различают:
1. повторная выборка. При повторном отборе вероятность попадания каждой отдельной единицы в выборку остается постоянной, так как после отбора какой-то единицы, она снова возвращается в совокупность и снова может быть выбранной. Повторная выборка в социально-экономической жизни встречается редко. Обычно выборку организуют по схеме бесповторной выборки.
2. бесповторная выборка. В этом случае каждая отобранная единица не возвращается обратно, и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастает).
Основные характеристики параметров генеральной и выборочной совокупностей обозначаются символами:
N - объем генеральной совокупности (число входящих в нее единиц);
n - объем выборки (число обследованных единиц);
- генеральная средняя (среднее значение признака в генеральной совокупности); - выборочная средняя;р - генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности);
w - выборочная доля;
s2 - генеральная дисперсия (дисперсия признака в генеральной совокупности);
S2 - выборочная дисперсия того же признака;
s - среднее квадратическое отклонение в генеральной совокупности;
S - среднее квадратическое отклонение в выборке.
Ошибки наблюдения
При большом числе единиц исследуемой совокупности ошибки и неточности могут погашаться, однако, если применяется выборочное наблюдение, тогда ошибки могут существенно повлиять на результаты исследования.
В ходе наблюдения могут возникнуть следующие ошибки:
1. Ошибки регистрации – ошибочные результаты наблюдения, полученные в результате недостаточной квалификации исследователя, неточности измерительных приборов, некорректности подсчетов и т.д.
2. Ошибки могут быть случайными и систематическими [12].
· Систематические ошибки репрезентативности – ошибки, вызванные нарушением правил выбора единиц совокупности для наблюдения;
· Ошибки репрезентативности (случайные) – ошибки, отражающие несовпадение выводов о части явления с выводами о явлении в целом. Такие ошибки возникают при применении несплошного метода наблюдения, случайные ошибки репрезентативности – ошибки, отражающие неравномерное распределение единиц в совокупности, в связи с чем, выборочная совокупность не корректно характеризует генеральную совокупность.
Средняя и предельная ошибка для показателей средней величины