Смекни!
smekni.com

Выборочное наблюдение. Испытание статистических гипотез (стр. 2 из 5)

Первая соответствует схеме возвратного шара, вторая — безвозвратного (при рассмотрении процесса отбора данных на примере отбора шаров разного цвета из урны). В социально- экономической статистике нет смысла применять повторную выборку, поэтому, как правило, имеется в виду бесповторный отбор. Если выборка проводится по схеме возвратного шара, то вероятность попадания любой единицы в выборку равна 1/N, и она остается той же самой на протяжении всей процедуры отбора. Если выборка проводится по схеме невозвратного шара, то вероятность попадания единицы в выборку изменяется последней. Поскольку социально-экономические объекты имеют сложную структуру, организовать выборку бывает довольно трудно. Например, чтобы провести отбор домохозяйств при изучении потребления населения крупного города, легче провести сначала отбор территориальных ячеек, жилых домов, потом квартир или домохозяйств, затем респондента. Такая выборка называется многоступенчатой. На каждой ступени используются разные единицы отбора: более крупные — на начальных ступенях, на последней ступени единица отбора совпадает с единицей наблюдения. Еще один вид выборочного наблюдения — многофазовая выборка. Такая выборка включает определенное количество фаз, каждая из которых отличается подробностью программы наблюдения. Например, 25% всей генеральной совокупности обследуются по краткой программе, каждая четвертая единица из этой выборки обследуется по более полной программе и т.д. При любом виде выборки отбор единиц проводится тремя отмеченными способами. Рассмотрим процедуру случайного отбора. Прежде всего составляется список единиц совокупности, в котором каждой единице присваивается цифровой код (номер или метка). Затем проводится жеребьевка. Шары с соответствующими номерами закладываются в барабан, перемешиваются, и проводится их отбор. Выпавшие номера соответствуют единицам, попавшим в выборку; число номеров равно запланированному объему выборки.

Отбор жеребьевкой может быть подвержен смещениям, вызванным недостатками техники (качеством шаров, барабана) и другими причинами. Более надежен с точки зрения объективности отбор по таблице случайных чисел. Такая таблица содержит серии цифр, чередующихся случайным образом, отобранных путем электронных сигналов. Поскольку мы пользуемся десятичной цифровой системой 0, 1,2, ..., 9, вероятность появления любой цифры равна 1/10.

Следовательно, если бы нужно было создать таблицу случайных чисел, включающую 500 знаков, то 50 из них были бы нули, столько же — единиц и т.д. Ввиду того, что каждая цифра и их последовательность являются случайными, можно использовать таблицу случайных чисел, перемещаясь либо по ее вертикали, либо по горизонтали. Цифры сгруппированы по пять для лучшей обозримости таблицы и пользования .

Пример. Предположим, что нам нужно провести 5%-ную выборку из 9540 студентов университета. Объем выборки составит: п = 5% - 7V = 477 студентов. Ввиду того, что объем генеральной совокупности выражается четырехзначным числом, код каждого студента должен быть четырехзначным: от 0001 — для первого студента до 9540 — для последнего студента в списке. Для того чтобы провести отбор по таблице случайных чисел, нужно выбрать начальную точку: можно закрыть глаза и поставить наугад точку в таблицу карандашом. Предположим, мы попали в 13-ю строку в 1-й столбец

Следовательно, единица с номером 9082 является первой в выборке. Если двигаться по строке, то единица с номером 2602 будет второй, 8088 — третьей, 9259 — четвертой. Следующий код 9610 пропускаем, так как у нас нет студента с таким номером. Далее в выборку попадают номера 4277, 2605, 6176, 8730, 4117, 7212, 1791, 5296, 5919, 0305, 1018. Код 9797 пропускается. Следующие отобранные номера 7868, 0161, 3747, 9526, 8413, 7725 и т.д.

Процедура продолжается, пока число отобранных номеров не составит требуемый объем выборки (n = 477). Часто используется отбор по какой-либо схеме (так называемая направленная выборка). Схема отбора принимается такой, чтобы отразить основные свойства и пропорции генеральной совокупности. Простейший способ — по спискам единиц генеральной совокупности, составленным так, чтобы упорядочивание единиц было бы не связано с изучаемыми свойствами, проводится механический отбор единиц с шагом, равным N: n. Обычно отбор начинают не с первой единицы, а отступив полшага, чтобы уменьшить возможность смещения выборки. Частота появления единиц с теми или иными особенностями, например студентов с тем или иным уровнем успеваемости, живущих в общежитии, и т.д., будет определяться той структурой, которая сложилась в генеральной совокупности. Для большей уверенности в том, что выборка отразит структуру генеральной совокупности, последняя подразделяется на типы, и проводится случайный или механический отбор из каждого типа. Общее число единиц, отобранных, из разных типов, должно соответствовать объему выборки. Особые трудности возникают, когда нет списка единиц, а отбор нужно провести либо на местности, либо из образцов продукции на складе готовой продукции. В этих случаях важно детально разработать схему ориентации на местности и схему отбора и следовать ей, не допуская отклонений.

Например, счетчик получает указание двигаться от определенной автобусной остановки на север по четной стороне улицы и, отсчитав два дома от первого угла, войти в третий и провести опрос в каждом пятом жилом помещении. Неукоснительное следование принятой схеме обеспечивает выполнение главного условия формирования репрезентативной выборки объективность отбора единиц.

От случайной выборки следует отличать квотный отбор, когда выборка конструируется из единиц определенных категорий (квот), которые должны быть представлены в заданных пропорциях. Например, при опросе покупателей универмага может быть запланировано провести отбор 150 респондентов, в том числе 90 женщин, из низ 25 — девушек, 20 — молодых женщин с маленькими детьми, 35 — женщин среднего возраста, одетых в деловой костюм, 10 — женщин старшего возраста; кроме того, планировался опрос 60 мужчин, из них 25 подростков и юношей, 10 — молодых мужчин с детьми, 15 —мужчин, которые одеты в костюмы, 10 — мужчин, одетых в спортивную одежду. Для определения потребительских ориентации и предпочтений такая выборка, может быть, и хороша, но если мы захотим по ней установить среднюю сумму покупок, их структуру, получим непредставительные результаты. Это происходит потому, что квотная выборка нацелена на отбор определенных категорий. Выборка может быть нерепрезентативной, даже если она формируется в соответствии с известными пропорциями генеральной совокупности, но отбор проводится без какой-либо схемы — единицы набираются, как угодно, лишь бы обеспечить соотношение их категорий в тех же пропорциях, что и в генеральной совокупности (например, соотношение мужчин и женщин, респондентов в возрасте моложе и старшетрудоспособного, в трудоспособном и т.д.).

Эти замечания должны предостеречь вас от подобных подходов к формированию выборки и еще раз показать необходимость объективного отбора.


1.3 Ошибка выборки

Все ошибки выборочного наблюдения подразделяются на ошибки выборки (случайные); ошибки, вызванные отклонением от схемы отбора (неслучайные); ошибки наблюдения (случайные и неслучайные). Плохо, когда ошибка выборки превышает допустимый размер погрешности, но слишком высокая точность также подозрительна и, как правило, свидетельствует об ошибках отбора. К неслучайным ошибкам приводят ошибки отбора. Так бывает, если объективный отбор подменяется «удобной» выборкой. Например, когда появляются добровольные респонденты — те, кто сами предлагают, чтобы их опросили. Очевидно, что характеристики таких добровольцев и недобровольцев могут быть различны и это приведет к ошибочному заключению о генеральной совокупности. Такая же опасность возникает при замене по какой-либо причине единиц, попавших в выборку, другими единицами (например, вместо отобранного домохозяйства, где в момент прихода интервьюера никто не открыл дверь, был проведен опрос в соседней квартире или интервьюер встретил решительный отказ участвовать в опросе и был вынужден пойти на замену домохозяйства). Как отмечает социолог В. И. Паниотто, систематические ошибки представляют собой некоторое постоянное смещение, которое не уменьшается с увеличением числа опрошенных и вызваны недостатками и просчетами в системе отбора респондентов. Если, например, для изучения общественного мнения жителей города в архитектурном управлении получить сведения о жилом фонде и из всех имеющихся в городе квартир отобрать случайным образом 400, а затем предложить интервьюерам опросить всех, кого они застанут в момент посещения в этих квартирах, то полученные данные не будут репрезентативны. Допущена систематическая ошибка: более подвижная часть населения попадает в выборку в меньшей пропорции, а менее подвижная — в большей пропорции, чем в генеральной совокупности.