Для определения средней ошибки механической выборки, а также необходимой ее численности используются соответствующие формулы, применяемые при собственно случайном бесповторном отборе, формулы
= (1.1)n =
(1.2)При этом, определив необходимую численность выборки и сопоставив ее с объектом генеральной совокупности, как правило, приходится производить соответствующее округление для получения целочисленного интервала отбора. Генеральная совокупность при механическом отборе можно ранжировать или упорядочить по величине изучаемого или коррелирующего с ним признака, что позволит повысить репрезентативность выборки. Однако в этом случае возрастает опасность систематической ошибки, связанной с занижением значений изучаемого признака (если из каждого интервала регистрируется первое значение) или его завышением (если из каждого интервала регистрируется последнее значение). Поэтому целесообразно из каждого интервала отбирать центральную или одну их двух центральных единиц. При этом порядковый номер единицы, с которой начинается отбор, определяется следующим образом. Если интервал отбора обозначить как k, то номер первой отбираемой единицы будет равен (k+1)/2 при k-нечетном и k/2 или (k+2)/2 при k-четном. Например, при 5-% выборке интервал отбора составит 20 единиц, тогда номер единицы, являющейся началом отбора, будет равен 20:2=10 или (20+2):2=11, т.е. отбор можно начинать с 10-й или 11-й единицы. В первом случае в выборку попадут 10, 30, 50, 70 и с таким же интервалом последующие единицы с номерами 11, 31, 51, 71 и т.д. Опасность систематической ошибки при механической выборке также может появиться вследствие случайного совпадения выбранного интервала и циклических закономерностей в расположении единиц генеральной совокупности. Так, при переписи населении 1989 г. в ходе 25%-го выборочного обследования семей была опасность попадания в выборку квартир только одного типа (например, только однокомнатных или только трехкомнатных), так как на лестничных площадках многих типовых домов располагаются именно по 4 квартиры. Чтобы избежать систематической ошибки, в каждом новом подъезде счетчик менял начало оборота.
1.2. Типическая (стратифицированная) выборка
Типический отбор целесообразно использовать в тех случаях, когда все единицы генеральной совокупности объединены в несколько крупных типических групп. Такие группы также называют стратами, или слоями, в связи с чем типический отбор также называют стратифицированным или расслоенным. При обследовании населения в качестве типических групп могут быть выбраны области, районы, социальные, возрастные или образовательные группы, при обследовании предприятий- отрасли или подотрасли, формы собственности и т.д.
Рассматривать генеральную совокупность в разрезе нескольких крупных групп единиц имеет смысл только в том случае, если средние значения изучаемых признаков по группам существенно различаются. Например, с большой уверенностью можно предположить, что доходы населения крупного города будут в среднем выше доходов населения, проживающего в сельской местности; численность работников промышленного предприятия в среднем будет выше численности работников торгового или сельскохозяйственного предприятия; средний возраст студентов будет значительно ниже среднего возраста занятого населения, и тем более пенсионеров. В то же время нет никакого смысла при выделении типических групп ориентироваться на признак, не связанный или очень слабо связанный с изучаемым. Например, при изучении доходов населения вряд ли улучшению результатов выборочного обследования будет способствовать деление населения на группы на основе первой буквы фамилии, так как маловероятно, что доходы людей, чья фамилия начинается с букв от А до К, будут существенно выше или ниже доходов лиц, носящих фамилию, начинающуюся с букв в интервале Л-Я.
Отбор единиц в выборочную совокупность из каждой типической группы осуществляется собственно-случайным или механическим способом. Поскольку в выборочную совокупность в той или иной пропорции обязательно попадают представители всех групп, типизация генеральной совокупности позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. В то же время в выделении типических группах обследуются далеко не все единицы, а только включенные в выборку. Следовательно, на величину полученной ошибки будет влиять различие между единицами внутри этих групп, т.е. внутригрупповая вариация. Поэтому ошибка типической выборки будет определяться величиной не общей дисперсии, а только ее части - средней из внутригрупповой дисперсий.
Отбор единиц в типическую выборку может быть организован либо пропорционально объему типических групп, либо пропорционально внутригрупповой вариации (дифференциации) признака.
При типической выборке, пропорциональной объему типических групп, число единиц, подлежащих отбору из каждой группы, определяется следующим образом:
(1.3) где - объем i-й группы
- объем выборки из i-й группы.
1.3. Собственно-случайная (простая случайная) выборка.
Случайная выборка - способ отбора, при котором каждый элемент генеральной совокупности имеет некоторую отличную от нуля вероятность быть отобранным. Различают простой случайный отбор (ПСО), когда вероятности попасть в выборку для каждого элемента равны (и отличны от нуля), и собственно случайный, или вероятностный, отбор. Реализовать процедуру ПСО можно двумя приемами: лотерейным методом и с помощью таблицы случайных чисел. При использовании лотерейного метода все элементы генеральной совокупности нумеруются числами от 1 до N, затем жетоны с номерами помещают в урну, тщательно перемешивают и извлекают последовательно n жетонов. Элементы совокупности, имеющие эти номера, и будут составлять выборку. Выделяют две схемы ПСО: отбор с возвращением (схема Боули), когда извлеченный жетон опять возвращается в урну, и отбор "без возвращения" (бесповторный). В схему Боули все испытания поставлены в одинаковые условия и независимы друг от друга. В схеме "без возвращения" состав урны после каждого испытания изменяется, в итоге несколько снижается средняя ошибка выборки и повышается устойчивость ее результатов. Однако если генеральная совокупность достаточно велика и доля отбора не превышает 5%, то схема "без возвращения" практически равноценна схеме Боули. Рассмотренные схемы, являясь классическим примером реализации ПСО, на практике становятся чрезвычайно трудоемкими, т. к. для обеспечения равного шанса выбора требуется тщательное перемешивание жетонов. Поэтому при формировании равновероятной выборки элементов их больших совокупностей пользуются таблицами случайных чисел. Отметим, что при организации ПСО все элементы генеральной совокупности должны быть пронумерованы. Случайным образом могут отбираться не только элементы совокупности, но и целые группы, состоящие в общем случае из различного числа элементов. Конкретное сборочное исследование обычно представляет собой сложную систему, в которой переплетаются различные схематичные элементы в сочетании с районированием, организацией многоступенчатого отбора и др. приемов формирования выборки. В основе построения любой выборки лежат два основных принципа: избежать смещенности результатов и добиться максимальной точности при заданных издержках. Единственный способ избежать смещений заключается в строгом соблюдении методики случайного отбора. Планы выборок могут отличаться разнообразием приемов, позволяющим повысить точность и снизить затраты на проведение исследования.
Прежде чем производить собственно-случайный отбор, необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку, в списках или перечне отсутствуют пропуски, нет игнорирования отдельных единиц и т.п. Следует также установить четкие границы генеральной совокупности таким образом, чтобы включение или невключение в нее отдельных единиц не вызывало сомнений. Так, например, при обследовании торговых предприятий необходимо указать, включит ли генеральная совокупность торговые павильоны, коммерческие палатки, передвижные торговые точки и прочие подобные объекты; при обследовании студентов важно определить, будут ли приняты во внимание студенты-заочники, экстерны, учащиеся в магистратуре, лица, находящиеся в академическом отпуске и т.п.