4. МЕТОД ВЫБОРОЧНЫХ НАБЛЮДЕНИЙ
4.1. Выборочное исследование
Пристатистическомисследованииэкономическихявлений могутприменятьсявыборочныенаблюдения,при которыххарактеристикигенеральнойсовокупностиполучаютсяна основанииизучения частигенеральнойсовокупности,называемойвыборочнойсовокупностьюили выборкой.
Выборочноенаблюдение (выборочноеисследование)заключаетсяв обследованииопределенногочисла единицсовокупности,отобранного,как правило,случайнымобразом. Привыборочномметоде обследованиюподлежит сравнительнонебольшая частьвсей изучаемойсовокупности(обычно до 5–10%,реже до 15–20%). Отборединиц из генеральнойсовокупностипроизводитсятаким образом,чтобы выборочнаясовокупностьбыла представительна
(репрезентативна)и характеризовалагенеральнуюсовокупность.Степень представительностивыборки зависитот способаорганизациивыборки и отее объема. Полнойрепрезентативностивыборки достичьне удается.Поэтому необходимаоценка надежностирезультатоввыборки и возможностиих распространенияна генеральнуюсовокупность.
Взависимостиот характеристиквыборочныхсовокупностейвыборки могутбыть представительными,расслоенными,засореннымии цензурированными.
Представительнаявыборка– выборка наблюденийиз генеральнойсовокупности,наиболее полнои адекватнопредставляющаяее свойства.
Расслоеннаявыборка– выборка, включающаяряд выборочныхсовокупностей,взятых изсоответствующихслоев генеральнойсовокупности.Широко используетсяпри выборочномобследованиив экономике,демографиии социологии.
Засореннаявыборка– выборка наблюдений,содержащая“грубые” ошибки.Основная массаэлементовзасореннойвыборки являетсяреализациейслучайнойвеличины X , закон распределениякоторой известен.Такие элементы– “типичные”– появляютсяв совокупностис вероятностью
.С вероятностью элементы совокупностиоказываютсяреализациейдругой случайнойвеличины Y , законраспределениякоторой в общемслучае неизвестен.Такие элементыназываются“грубыми”ошибками. Обычныеоценки, например,средняя арифметическаявыборочная,на засореннойвыборке теряютсвои оптимальныесвойства(эффективность,несмещенность)с ростом интенсивностизасорения .Цензурированнаявыборка– выборка, полученнаяиз вариационногоряда наблюденийпутем отбрасываниянекоторогочисла экстремальныхнаблюдений.Если отбрасываниепроизводитсяпо признакувыхода наблюденийза пределызаданногоинтервала, тотакой приемназываетсяцензурированиепервого типа.В этом случаечисло оставшихсянаблюденийявляется случайнойвеличиной. Еслиотбрасываетсяфиксированнаядоля
крайних малыхзначений ификсированнаядоля крайних большихзначений, тоэто называетсяцензурированиемвторого типауровня При этом, числооставшихсяв рассмотрениинаблюденийявляется величинойзаранее заданной.Проведениевыборочныхисследованийстатистическойинформациисостоит изследующихэтапов:
–формулировкацели статистическогонаблюдения;
–обоснованиецелесообразностивыборочногонаблюдения;
–отграничениегенеральнойсовокупности;
–установлениесистемы отбораединиц длянаблюдения;
–определениечисла единиц,подлежащихотбору;
–проведениеотбора единиц;
–проведениенаблюдения;
–расчет выборочныххарактеристики их ошибок;
–распространениевыборочныхданных на генеральнуюсовокупность.
Выборочноеисследованиеосуществляется с минимальнымизатратами трудаи средств и вболее короткиесроки, чем сплошноенаблюдение,что повышаетоперативностьстатистическойинформации,уменьшаетошибки регистрации.В проведенииряда исследованийвыборочныйметод являетсяединственновозможным,например, приконтроле качествапродукции,сопровождающимсяразрушениемпроверяемогоизделия.
Выборочныйметод даетдостаточноточные результаты,поэтому онможет применятьсядля проверкиданных сплошногонаблюдения.Минимальнаячисленностьобследуемыхединиц позволяетпровести исследованиеболее тщательнои квалифицированно.Например, припереписяхнаселенияпрактикуютсявыборочныеконтрольныенаблюдениядля проверкиправильностизаписей сплошногонаблюдения.
Воснове теориивыборочногонаблюдениялежат теоремызаконов большихчисел, которыепозволяютрешить двавзаимосвязанныхвопроса выборки:рассчитатьее объемпри заданнойточности исследованияи определитьошибку приданном объемевыборки.
Прииспользованиивыборочногометода обычноиспользуютсядва вида обобщающихпоказателей:относительнуювеличинуальтернативногопризнакаи среднюювеличинуколичественногопризнака.
Относительнаявеличинаальтернативногопризнакахарактеризуетдолю(удельный вес)единиц в статистическойсовокупности,обладающихизучаемымпризнаком. Вгенеральнойсовокупностиэта доля единицназываетсягенеральнойдолей (p),а в выборочнойсовокупности– выборочнойдолей (w).
Средняявеличинаколичественногопризнака вгенеральнойсовокупностиназываетсягенеральнойсредней(
),а в выборочнойсовокупности– выборочнойсредней( ).4.2. Виды отборапри выборочном наблюдении
Процессобразованиявыборки называетсяотбором,который осуществляетсяв порядкебеспристрастного,случайногоотбора единициз генеральнойсовокупности.
Основнымусловием проведениявыборочногонаблюденияявляетсяпредупреждениевозникновениясистематических(тенденциозных)ошибок, возникающихвследствиенарушенияпринципа равныхвозможностейпопадания ввыборку каждойединицы совокупности.Предупреждениесистематическихошибок достигаетсяв результатеприменениянаучно обоснованныхспособов формированиявыборочнойсовокупности.Существуютразличныеспособы отбора:индивидуальный,групповой(серийный),комбинированный, повторный(возвратный),бесповторный(безвозвратный),одноступенчатый,многоступенчатый,собственно–случайный,механический,типический,двухфазныйи многофазныйотбор
Прииндивидуальномотборе ввыборку отбираютсяотдельныеединицы совокупности.Отбор повторяетсястолько раз,сколько необходимоотобрать единиц.
Групповой(серийный) отборзаключаетсяв отборе серий(например, отборизделий дляпроверки ихцелыми партиями).Если обследованиюподвергаютсявсе единицыотобранныхсерий, отборназываетсясерийным,а если обследуетсятолько частьединиц каждойсерии, отбираемыхв индивидуальнымпорядке изсерии, то –комбинированным.
Еслив процессеотбора отобраннаяединица неисключаетсяиз совокупности,т.е. возвращаетсяв совокупность,и может бытьповторно отобранной,то такой отборназываетсяповторнымили возвратным,в противномслучае – бесповторнымили безвозвратным.Серийный отбор,как правило,безвозвратный.
Приповторномотборе вероятностьпопадания ввыборочнуюсовокупностьвсех единицгенеральнойсовокупностиостается одинаковой.При бесповторном- для оставшихсяединиц совокупностивероятностьпопадания ввыборку увеличивается.
Приодноступенчатомотбираютсяединицы совокупности(или серии)непосредственнодля наблюдения.При многоступенчатомотбираютсясначала крупныесерии единиц(первая ступеньотбора), наблюдениюони не подвергаются.Затем из нихотбираютсясерии, меньшиепо численностиединиц (втораяступень), наблюдениюне подвергаются,и так до техпор, пока небудут отобраныте единицысовокупности(серии), которыебудут подвергнутынаблюдению.
Собственно–случайныйотбор состоитв отборе единиц(серий) из всейгенеральнойсовокупностив целом посредствомжеребьевкиили на основаниитаблиц случайныхчисел.
Жеребьевкасостоит в том,что на каждуюединицу отборасоставляетсякарточка, которойприсуждаетсяпорядковыйномер. Послетщательногоперемешиванияпо очередиизвлекаютсякарточки, покане будет отобранотребуемое числоединиц.
Случайнымичисламиназываютсяряды чисел,являющихсяреализациямипоследовательностивзаимно независимыхи одинаковораспределенныхслучайныхвеличин. Этипоследовательностичисел получаютсялибо с помощьюфизическихгенераторов(подбрасываниекубиков с нанесеннымина их сторонамицифрами; вытягиваниемиз урны карточекс написаннымина них цифрами,преобразованиеслучайныхсигналов и др.физико–техническиепроцессы), либос помощью программныхгенераторов(аналитическимметодом с помощьюпрограмм дляЭВМ). Числа,являющиесярезультатамисоответствующейвычислительнойпроцедуры,называютсяпсевдослучайнымичислами.Последовательностьпсевдослучайныхчисел носитдетерминированныйхарактер, нов определенныхграницах онаудовлетворяетсвойствамравномерногораспределенияи свойствуслучайности.
Случайныечисла могутбыть выбраныпо таблицеслучайных чисел(приложение1), которая содержит2000 случайныхчисел, объединенныхдля удобствапользованиятаблицей в 500блоков по 4 значения)Например,
5489, 5583, 3156, 0835, 1988, 3912.
Применениекомбинацийэтих цифр зависитот размерасовокупности:если в генеральнойсовокупности1000 единиц, топорядковыйномер каждойединицы долженсостоять издвух цифр от000 до 999. В этом случаепервые 8 номеровединиц выборочнойсовокупностиследующие:
548, 955, 833, 156, 083, 519, 883, 912.
При произвольномобъеме генеральнойсовокупности,отличающегосяот 100, 1000, 10000 могутиспользоватьсяпсевдослучайныечисла, сформированныена ЭВМ, или изтаблицы случайныхчисел формируетсяпоследовательностьслучайныхвеличин, распределенныхв интервалеот 0 до 1. Например,в приведенномвыше примере
0,5489; 0,5583; 0,3156; 0,0835; 0,1988; 0,3912 ит.д.
Если генеральнаясовокупностьсостоит из 2000единиц, то ввыборочнуюсовокупностьдолжны войтиединицы с номерами:
2000 Ч0,5489 = 1097,8 или 1099;
2000 Ч0,5583 = 1116,6 или 1117;
2000 Ч0,3156 = 631,2 или 631;
2000 Ч0,0835 = 167,0 или 167;
2000 Ч0,1988 = 397,6 или 398;
2000 Ч0,3912 = 782,4 или 782.
Процессформированияслучайных чисели определенияномера отбираемойединицы продолжаетсядо тех пор, покане будет получензаданный объемвыборочнойсовокупности.
Можно предложитьдругой способслучайногоотбора единицв выборку. Допустим,что выборкасостоит из 75единиц, а генеральнаясовокупность- из 780. Из таблицыслучайных чиселвыбираются,например, следующие
5489, 5583, 3156, 0835, 1988, 3912.
Ввыборку могутвойти толькоединицы, порядковыеномера которыхравны трехзначнымчислам меньше780. Поэтому, используятолько трипоследние цифрыкаждого числа,отбираетсянеобходимые75 номеров: 489, 583, 156 ит.д. Можно использоватьи первые трицифры каждогочисла, тогдаотобранныеномера: 548, 558, 315, 83, 198,391. Можно разбитьслучайныечетырехзначныеслучайные числана ряд, состоящийиз трехзначныхчисел:
548, 955, 833, 156, 083, 519, 883, 912
и отобратьиз них номера,которые меньше780, а именно: 548, 156,83, 519.
Механическийотборзаключаетсяв том, что составляетсясписок единицгенеральнойсовокупностии в зависимостиот числа отбираемыхединиц (серий)устанавливаетсяшаг отбора,т.е. через какойинтервал следуетбрать для наблюденияединицы (серии).Например, впростейшемслучае, при 10%–м отборе,отбираетсякаждая десятаяединица поэтому списку,т.е. если первойвзята единицаза № 1, то следующимиотбираются11–я, 21–я и т.д. Втакой последовательностипроизводитсяотбор, еслиединицы совокупностирасположеныв списке безучета их “рангов”,т.е. значимостипо изучаемымпризнакам.Начало отборав этом случаене имеет значения,его можно начатьв приведенномпримере отлюбой единицыиз первогодесятка. Прирасположенииединиц совокупностив ранжированномпорядке заначало отборадолжна бытьпринята серединаинтервала (шагаотбора) во избежаниесистематическойошибки выборки.
Придостаточнобольшой совокупностиэтот способотбора близокк собственнослучайному,при условии,что применяемыйсписок не составлентаким образом,чтобы какие-тоединицы совокупностиимели большешансов попастьв выборку.
Притипическомотборегенеральнаясовокупностьразбиваетсяна типическиегруппы единицпо какому–либопризнаку (формируютсяоднородныесовокупности),а затем из каждойиз них производитсямеханическийили собственно–случайныйотбор. Отборединиц из типовпроизводитсятремя методами:пропорциональночисленностиединиц типическихгрупп, непропорциональночисленностиединиц типическихгрупп и пропорциональноколеблемостипризнакав группах.
Вцелях экономиисредств данныепо некоторыминтересующимисследователяпризнакам можноанализироватьна основанииизучения всехединиц выборочнойсовокупности,а по другимпризнакам - наосновании частиединиц выборочнойсовокупности,которые представляютподвыборкуиз единицпервоначальнойвыборки. Этотметод называетсядвухфазнымотбором.При наличиинесколькихподвыборок- методмногофазногоотбора.
Многофазныйотбор по своейструктуреотличаетсяот многоступенчатогоотбора, так примногофазномотборе используютсяна каждой фазеодни и те жеотобранныеединицы, примногоступенчатомотборе на разныхступенях применяютсяединицы отбораразных порядков.Многофазнымотбором чащевсего пользуютсяв тех случаях,когда различночисло единиц,необходимыхдля определенияотдельныхпоказателейс заданнойточностью. Этосвязано какс различиямив степениколеблемостипризнаков, таки с разной точностью,требуемой длярасчетов. Ошибкипри многофазнойвыборке рассчитываютсяна каждой фазеотдельно.
Всевиды отбора,поскольку онимогут бытьповторнымиили бесповторными,имеют разновидности(табл.1)
Таблица1
Видотбора | Разновидностиотбора в зависимостиот | |
повторяемостиотбора единицсовокупности | отвеличины серийили пропорциональностиотбора единицсовокупностив группах | |
Собственнослучайный | 1.Собственнослучайный повторный 2.Собственнослучайный бесповторный | |
Механический | 1.Механический повторный 2.Механический бесповторный | |
Серийный | 1.Серийный сповторным отборомсерий 2.Серийный сбесповтор- нымотбором серий | 1.1.Серийный сповторнымотбором равновеликихсерий 1.2.Серийный сповторнымотбором неравновеликихсерий 2.1.Серийный сбесповторномотбором равновеликихсерий 2.2.Серийный сбесповторномотбором неравновеликихсерий |
Комбиниро-ванный | 1.Комбинированныйс повторнымотбором серий 2.Комбинированныйс бесповторнымотбором серий | 1.1.Комбинированныйс повторным отборомравновеликихсерий 1.2.Комбинированныйс повторным отборомнеравновеликихсерий 2.1.Комбинированныйс бесповторным отборомравновеликихсерий 2.2.Комбинированныйс бесповторным отборомнеравновеликихсерий |
Типический | 1.Типическийс повторным случайномотборе внутри групп 2. Типическийпри бесповторномслучайномотборе внутри групп | 1.1.Типическийс повторнымслучайном отборе внутри групп, пропорциональ- ном объемугрупп 1.2.Типическийс повторнымслучайном отборе внутри групп, непропорцио- нальномобъему групп 1.3.Типическийс повторнымслучайном отборе внутри групп, пропорциональ- ном колеблемостив группах 2.1.Типическийс бесповторнымслучайном отборе внутри групп, пропорциональ- ном объемугрупп 2.2.Типическийс бесповторнымслучайном отборе внутри групп, непропорцио- нальномобъему групп 2.3.Типический бесповторнымслучайном отборе внутри групп, пропорциональ- номколеблемостив группах |
4.3. Ошибки выборочного отбора
Разностьмежду показателямивыборочнойи генеральнойсовокупностиназываетсяошибкойвыборки.Ошибки выборкиподразделяютсяна ошибки регистрациии ошибкирепрезентативности.
Ошибкирегистрациивозникают из-занеправильныхили неточныхсведений. Источникамитаких ошибокмогут бытьнепониманиесущества вопроса,невнимательностьрегистратора,пропуск илиповторный счетнекоторыхединиц совокупности,описки призаполненииформулярови т.д.
Среди ошибокрегистрациивыделяютсясистематические,обусловленныепричинами,действующими в каком-то одномнаправлениии искажающимирезультатыработы (например,округлениецифр, тяготениек полным пятеркам,десяткам ит.д.), и случайные,проявляющиесяв различныхнаправлениях,уравновешивающиедруг друга илишь изредкадающие заметныйсуммарный итог.
Расхождениемежду значениямиизучаемогопризнака выборочнойи генеральныхсовокупностейявляется ошибкой репрезентативности(представи-тельности).Она может бытьслучайной исистематической.Случайнаявозникает всилу того, чтовыборочноестатистическоенаблюдениеявляется несплошнымнаблюдением,и выборканедостаточноточно воспроизводит(репрезентирует)генеральнуюсовокупность.
Систематическиеошибка репрезентативностивозникают из-занеправильного,тенденциозногоотбора единиц,при которомнарушаетсяосновной принципнаучно организованнойвыборки - принципслучайности.
Приопределениивеличинырепрезентативнойошибки предполагается,что ошибкарегистрацииравна нулю.Определениеошибки производитсяпо формуламошибкивыборочнойдоли и ошибкивыборочнойсредней.Систематическаяошибка репрезентативностивозникаетвследствиенарушенияправил отбораединиц генеральнойсовокупности,в частностипринципабеспристрастного,непреднамеренногоотбора. Систематическаяошибка можетпривести кполной непригодностирезультатовнаблюдений.
Рассмотримна примере,насколькоотличаютсявыборочныеи генеральныепоказателипо данным обуспеваемостистудентов (две10%-е выборки):
Оценка | Числостудентов,чел | ||
Генеральнаясовокупность | Перваявыборка | Втораявыборка | |
2 3 4 5 | 100 300 520 80 | 9 27 54 10 | 12 29 52 7 |
Итого | 1000 | 100 | 100 |
Средний баллдля генеральнойсовокупности
попервой выборке
повторой выборке
Доля студентов,получившихоценки "4" и "5":
погенеральнойсовокупности
попервой выборке
повторой выборке
Разностьмежду показателямивыборочнойи генеральнойсовокупностиявляется случайнойошибкой репрезентативности(ошибкой выборки).
Ошибкирепрезентативности:
Как видноиз расчетов,выборочнаясредняя и выборочнаядоля являютсяслучайнымивеличинами,которые могутприниматьразличныезначения взависимостиот того, какиеединицы совокупностипопали в выборку.
4.3.1. Ошибка выборочной средней
Ошибка выборочнойсредней представляетсобой расхождение(разность) междувыборочнойсредней
и генеральнойсредней ,возникающеевследствиенесплошноговыборочногохарактеранаблюдения.Величина ошибкивыборочнойсредней определяетсякак пределотклонения от ,гарантируемыйс заданнойвероятностью:где
– гарантийныйкоэффициент,зависящий отвероятности , с которойгарантируетсяневыход разности за пределы ; – средняя ошибкавыборочнойсредней.Значениягарантийногокоэффициента
и соответствующиеим вероятности приведеныв табл.4.1.Обычно вероятностьпринимаетсяравной 0,9545 или0,9973, а при этом равносоответственно2 и 3.Таблица 4.1
Значениягарантийногокоэффициента
1,00 1,10 1,20 1,30 1,40 1,50 1,60 | 0,6827 0,7287 0,7699 0,8064 0,8385 0,8664 0,8904 | 1,70 1,80 1,90 2,00 2,10 2,20 2,30 | 0,9109 0,9281 0,9426 0,9545 0,9643 0,9722 0,9786 | 2,40 2,50 2,60 2,70 2,80 2,90 3,00 | 0,9836 0,9876 0,9907 0,9931 0,9949 0,9963 0,9973 |
Н.В.Смирнов,И.В.Дунин-Барковский.Курс теориивероятностейи математическойстатистикидля техническихприложений.- М.: Наука, 1965. 512 с.
Стр.173
Средняя ошибкаопределяетсякак среднееквадратическоеотклонениесредней величиныв генеральнойсовокупности(средней генеральной)
Вматематическойстатистикедоказывается,что величинасредней квадратическойстандартнойошибки простойслучайнойповторнойвыборки можетбыть определенапо формуле
где
-дисперсияпризнака вгенеральнойсовокупности.Дисперсиясуммы независимыхвеличин равнасумме дисперсийслагаемых
Есливсе величины Xiимеютодинаковуюдисперсию, то
Тогда дисперсиясредней
Тогда средняяошибка приопределениисреднейМежду дисперсиямив генеральнойи выборочнойсовокупностяхсуществуетследующеесоотношение:
где
–дисперсияпризнака ввыборке.Если n достаточновелико, то
близко к единицеи дисперсиюв генеральнойсовокупностиможно заменитьна дисперсиюв выборке.Тогда средняяошибка среднейв генеральнойсовокупностиможет быть каксреднее квадратическоеотклонениесредней величиныв выборочнойсовокупности(средней выборочной)
Средняя ошибкавыборочнойсредней
Значениясредней ошибкивыборки определяютсяпо формуле
где
– дисперсияв генеральнойсовокупности.Между дисперсиямив генеральнойи выборочнойсовокупностяхсуществуетследующеесоотношение:
где
–дисперсия ввыборке.Если n достаточновелико, то
близко к единицеи дисперсиюв генеральнойсовокупностиможно заменитьна дисперсиюв выборке.При повторномотборе средняяошибка определяетсяследующимобразом:
где
– средняя величинадисперсииколичественногопризнака ,которая рассчитываетсяпо формулесредней арифметическойневзвешеннойилисредней арифметическойвзвешенной
где fi – статистическийвес.
Формулырасчета среднейошибки выборочнойсредней дляразличных,наиболее частоиспользуемыхспособов отборавыборочнойсовокупностиприведены втабл.4.2.
Таблица 4.2
Формулырасчета среднихошибок выборочнойдоли
и выборочнойсредней
Методотбора выборки | Средняяошибка | |
выборочнойдоли | выборочнойсредней | |
Механическийили собственно–случайныйповторныйотбор | | |
Механическийили собственно–случайныйбесповторныйотбор | | |
Серийныйотбор приповторномотборе равновеликихсерий | | |
Серийныйотбор прибесповторномотборе равновеликихсерий | | |
Типическийотбор приповторномслучайномотборе внутригрупп, пропорциональномобъему групп | | |
Типическийотбор прибесповторномслучайномотборе внутригрупп, пропорциональномобъему групп |
где N – численностьгенеральнойсовокупности;
– межсерийнаядисперсиявыборочнойдоли;
r – число отобранныхсерий;
R – число серийв генеральнойсовокупности;
– средняяиз групповыхдисперсийвыборочнойдоли;
– дисперсияпризнака x в выборке;
– межсерийнаядисперсиявыборочныхсредних;
– средняяиз групповыхдисперсийвыборочнойсредней.
При бесповторномоборе с каждойотобраннойединицей илисерией вероятностьотбора оставшихсяединиц илисерий повышается,при этом средняяошибка выборочнойсредней уменьшаетсяпо сравнениюс повторнымотбором и имеетследующий вид:
длямеханическогоили собственнослучайногобесповторногоотбора
При достаточнобольшом объемесовокупности N можно воспользоватьсяформулой
длясерийногобесповторногоотбора равновеликих серий
При достаточнобольшом числесерий в генеральнойсовокупности R можновоспользоватьсяформулой
длятипическогоотбора с бесповторнымслучайномотборе внутригрупп, пропорциональномобъему групп
Межсерийнаядисперсиявыборочныхсредних
и средняя извыборочныхдисперсийтипическихгрупп вычисляютсяследующимобразом:где
– среднее значениепоказателя в j– й серии;– дисперсияпризнака x в j– й типическойгруппе;
nj – числоединиц в j –й типическойгруппе.
И.Г.Венецкий,В.И.Венецкая.Основныематематико-статистическиепонятия и формулыв экономическоманализе. - М.:Статистика,1974. 279 с.
Средние ошибкивыборки притипическомметоде отбора,пропорциональномобъему группи колеблемостипризнака вгруппе приведеныв табл.3
Таблица 3
Формулырасчета среднихошибок выборочнойсредней
и выборочнойдоли при типическомметоде отбора
Методотбора выборки | Средняяошибка | |
выборочнойдоли | выборочнойсредней | |
повторныйслучайныйотбор внутригрупп, непропорциональныйобъему групп | | |
бесповторныйслучайныйотбор внутригрупп, непропорциональныйобъему групп | ||
повторныйслучайныйотбор внутригрупп, пропорциональныйколеблемостипризнакав группах | ||
бесповторныйслучайныйотбор внутригрупп, пропорциональныйколеблемостипризнака вгруппах | | |
где Nj – число единицв j –й типическойгруппе;
nj – числоотобранныхединиц в j –й типическойгруппе;
– выборочнаядисперсияпризнака x в j– й типическойгруппе
(дисперсияпризнака ввыборке из j– й типическойгруппы);
– выборочнаядисперсия доли в j– й типическойгруппе
(дисперсиядоли в выборкеиз j– й типическойгруппы);
– среднееквадратическоеотклонениепризнака x в выборкеиз
j– й типическойгруппе;
Средние ошибкивыборки прикомбинированнойвыборке сравновеликимисериями приведеныв табл.4
Таблица 4
Формулырасчета среднихошибок выборкипри комбинированной
выборке сравновеликимисериями
Методотбора выборки | Средняяошибка | |
выборочнойдоли | выборочнойсредней | |
повтор-ныйотбор серий | ||
бесповторныйотбор серий | | |
где
- общее числоединиц в отобранныхсериях ( );n - выбранноечисло единиц,подвергающихсяобследованию, из отобранных
серий.
При многоступенчатомотборе на каждойступени отбораможет бытьнайдена своясредняя ошибка.При отборе,например,
крупныхгрупп из генеральнойсовокупностисредняя ошибкавыборки - ;при отборе мелких группиз крупныхсредняя ошибкавыборки - ;при отборе отдельныхединиц совокупностииз мелких группсредняя ошибкавыборки - .Если численностьгрупп одинаковая,то средняяошибка, как длясредней, таки для доли,трехступенчатогоотбора можетбыть определенапо формулеПредельнаяошибка выражаетсяследующимобразом:
изависит отвариации изучаемогопризнака вгенеральнойсовокупности,объема и доливыборки, способаотбора единициз генеральнойсовокупностии от величинывероятности,с которойгарантируютсярезультатывыборочногонаблюдения.
Средняявеличинаколичественногопризнака вгенеральнойсовокупностиопределяетсяс у четом предельнойошибки выборочнойсредней
Иногда дляопределенияразмеров предельнойошибки величина
определяетсяиз эмпирическойформулы (И.Г.Венецкий,В.И.Венецкая.Основныематематико-статистическиепонятия и формулыв экономическоманализе. - М.:Статистика,1974. 279 с. - стр.188)4.3.2. Ошибка выборочной доли
Выборочнаядоля представляетсобой отношениечисла единиц,обладающихданным признакомили данным егозначением ( m) к общему числуединиц выборочнойсовокупности ( n )
(Этустатистическуюхарактеристикуне следуетпутать с долейвыборки, являющейсяотношениемчисла единицвыборочнойсовокупностик числу единицгенеральнойсовокупности).
Ошибка выборочнойдоли представляетсобой расхождение(разность) междудолей в выборочнойсовокупности ( w )и долей в генеральнойсовокупности ( p ),возникающеевследствиенесплошногохарактеранаблюдения.Величина ошибкивыборочнойдоли определяетсякак пределотклоненияw от p ,гарантируемыйс заданнойвероятностью:
где
– гарантийныйкоэффициент,зависящий отвероятности , с которойгарантируетсяневыход разности w –p за пределы ; – средняя ошибкавыборочнойдоли.Средняяошибка выборочнойдоли определяетсяпо формуле
Или,как было доказановыше,
где
– дисперсиядоли в генеральнойсовокупности(дисперсиягенеральнойдоли);– дисперсиядоли в выборке(дисперсиявыборочнойдоли).
Приведеннаяформула среднейошибки выборочнойдоли применяетсяпри повторномотборе.
Дляопределениядисперсииальтернативногопризнака допустим,что общее числоединиц совокупностиравно n . Числоединиц,обладающихданным признаком -f , тогда числоединиц, не обладающихданным признаком,равно n-f . Ряд распределениякачественного(альтернативного)признака
Значениепеременной | Частотаповторений |
1 0 | f n-f |
Итого | n |
Средняяарифметическаятакого рядаравна:
тоесть равнаотносительнойчастолте (частости)появленияданного признака,которую можнообозначитьчерез p , тогда
Таким образом,доля единиц,обладающихданным признакомравна p; соответственнодоля единиц,не обладающихданным признаком,равна q ; p+q=1. Тогдадисперсияальтернативногопризнака определяетсяпо формуле
Дляпоказателядоли альтернативногопризнака ввыборке (выборочнойдоли) дисперсияопределяетсяпо формуле
Прибесповторномотборе численностьгенеральнойсовокупностисокращается,поэтому дисперсияумножаетсяна коэффициент
Формулы расчетасредних ошибоквыборочнойдоли для различныхспособов отбораединиц из генеральнойсовокупностиприведены втабл. 4.2; 3 и 4.Дисперсиив формулахрасчета среднихошибок выборочнойдоли в табл.4.2.рассчитываютсяследующимобразом:
–межсерийнаядисперсиявыборочнойдоли
где wj – выборочнаядоля в j –й серии;
– средняявеличина доливо всех сериях;
–средняя изгрупповыхдисперсий
где wj – выборочнаядоля в j –й типическойгруппе;
nj – числоединиц в j –й типическойгруппе;
k – число типическихгрупп.
Для случая,когда доля(частость) дажеприблизительнонеизвестна,можно произвести"грубый" расчетсредней ошибкивыборки длядоли, используяв расчетемаксимальнуювеличину дисперсиидоли, равную0,25. Тогда для
повторногоотбора
бесповторногоотбора
Предельноезначение ошибкивыборочнойдоли определяетсяпо следующейформуле:
Величинасредней ошибкивыборочнойдоли
зависитот доли изучаемогопризнака вгенеральнойсовокупности,числа наблюденийи способа отбораединиц из генеральнойсовокупностидля наблюдения,а величинапредельнойошибки зависит ещеи от величинывероятности ,с которойгарантируютсярезультатывыборочногонаблюдения.Распространениевыборочныхданных на генеральнуюсовокупностьпроизводитсяс учетом доверительныхинтервалов.Доля альтернативногопризнака вгенеральнойсовокупностиравна
Пример
Сущностьпроцесса случайногоотбора и основныесвойства простойповторнойвыборки можнопоказать наусловном примере.
Генеральнаясовокупностьсостоит из трехединиц ( N = 3 ), например
Порядковыйномер рабочего | 1 | 2 | 3 | 4 |
Тарифныйразряд, xi | 3 | 4 | 4 | 5 |
Генеральнаясредняя
разряд;генеральнаядисперсия
долярабочих в генеральнойсовокупности,имеющих 4 тарифныйразряд
Задача. Определитьпараметрыгенеральнойсовокупности( средний разряд,дисперсию идолю рабочихс тарифнымразрядом, равным4) по результатампроведенияпростой случайнойповторнойвыборки объемом2 единицы ( n = 2 ).
Вданном примерес одинаковойстепенью вероятностимогла бы появитьсялюбая из 16 возможныхкомбинацийединиц, то естьлюбая из 16 возможныхвыборок. Результаты16 выборок приведеныв табл. 1
Таблица 1
Номервыборки | Номераединиц, входящихв выборку | Значенияпризнака поданным выборки | Выборочнаясредняя | Отклонениевыборочнойсредней отгенеральнойсредней | Выбо- рочная доля |
1 | 1; 1 | 3; 3 | 3,0 | -1,0 | 0,0 |
2 | 1; 2 | 3; 4 | 3,5 | -0,5 | 0,5 |
3 | 1; 3 | 3; 4 | 3,5 | -0,5 | 0,5 |
4 | 1; 4 | 3; 5 | 4,0 | 0,0 | 0,0 |
5 | 2; 1 | 4; 3 | 3,5 | -0,5 | 0,5 |
6 | 2; 2 | 4; 4 | 4,0 | 0,0 | 1,0 |
7 | 2; 3 | 4; 4 | 4,0 | 0,0 | 1,0 |
8 | 2; 4 | 4; 5 | 4,5 | +0,5 | 0,5 |
9 | 3; 1 | 4; 3 | 3,5 | -0,5 | 0,5 |
10 | 3; 2 | 4; 4 | 4,0 | 0,0 | 1,0 |
11 | 3; 3 | 4; 4 | 4,0 | 0,0 | 1,0 |
12 | 3; 4 | 4; 5 | 4,5 | +0,5 | 0,5 |
13 | 4; 1 | 5; 3 | 4,0 | 0,0 | 0,0 |
14 | 4; 2 | 5; 4 | 4,5 | +0,5 | 0,5 |
15 | 4; 3 | 5; 4 | 4,5 | +0,5 | 0,5 |
16 | 4; 4 | 5; 5 | 5,0 | +1,0 | 0,0 |
Возможныеварианты значенийвыборочныхсредних и отклоненияих от генеральнойсредней представленыв виде рядараспределения(табл.2)
Таблица 2
Выборочныесредние разрядырабочих | Число выборокс данной выборочнойсредней fj | Отклонениевыборочнойсредней отгенеральнойсредней | Вероятностьпоявленияданного значениявыборочнойсредней (иливеличиныотклонениявыборочнойсредней отгенеральной) |
3,0 | 1 | -1,0 | 0,0625 |
3,5 | 4 | -0,5 | 0,2500 |
4,0 | 6 | 0,0 | 0,3750 |
4,5 | 4 | +0,5 | 0,2500 |
5,0 | 1 | +1,0 | 0,0625 |
Итого | 16 | 1,0000 |
Враспределениивеличин выборочныхсредних и ихотклоненийнаблюдаютсяопределенныезакономерности.
1.Из возможныхрезультатовслучайнойповторнойвыборки наиболеевероятны такие,при которыхвеличина выборочнойсредней будетблизка к величинегенеральнойсредней. Такимобразом, чембольше величинаслучайнойошибки выборки,тем менее вероятнопоявление такойошибки.
2. В примере невстречаютсяошибки большеединицы поабсолютнойвеличине, т.е.всегда существуетпредел расхождениймежду выборочнойи генеральнойсредней.
Поданным табл.2,где представленывсе возможныеварианты выборочныхсредних и ихотклоненияот генеральнойсредней, определяетсявеличина стандартнойошибки выборки
Однако напрактикеисследовательоперируетданными какой-тоодной конкретнойвыборки, а поэтомууказаннымспособом определитьстандартнуюошибку среднейневозможно.
Среднюю ошибкуможно определитьпо формуле,используявеличину дисперсиив генеральнойсовокупности(в данном примерегенеральнаядисперсияпризнака равна0,5)
Распределениевыборочнойдоли представленов табл.3
Таблица 3
Выборочнаядоля | Число выборокс данной выборочнойдолей fj | Отклонениевыборочнойдоли от генеральной | | |
0,0 | 4 | -0,5 | 0,0 | 1,0 |
0,5 | 8 | 0,0 | 4,0 | 0,0 |
1,0 | 4 | +0,5 | 4,0 | 1,0 |
Итого | 16 | 8,0 | 2,0 |
Всреднем длявсех возможныхвариантоввыборок величинавыборочнойдоли совпадаетс долей признакав генеральнойсовокупности
Средняяквадратическаяошибка долив генеральнойсовокупности
Среднююквадратическуюошибку долив генеральнойсовокупностиможно определить,используя долюпризнака вгенеральногосовокупности ( p = 0,5),
Вформулы среднихошибок выборки
;входятдисперсиипризнака и долив генеральнойсовокупности,величины которых,как правило,при проведениивыборочногонаблюдениянеизвестны.Поэтому длярасчета среднихошибок выборкиприходитсяиспользоватьвыборочныедисперсии вкачестве оценкигенеральнойсовокупности.
4.4. Объем выборки
Определениенеобходимого объемавыборки n основываетсяна формулахпредельныхошибок выборочнойдоли и выборочнойсредней. Например,для повторногоотбора предельныеошибки равны
отсюдаобъемы выборокдля расчетавыборочнойдоли nw и выборочнойсредней nx следующие:
Аналогичнымобразом определяютсяобъемы выборокпри различныхспособах отборавыборочнойсовокупности.Для серийногоотбора определяетсячисло отобранныхсерий. Формулырасчета приведеныв табл.4.3.
Таблица 4.3
Формулырасчета объемавыборки
Методотбора выборки | Объемвыборки иличисло серийдля определения | |
выборочнойдоли | выборочнойсредней | |
Механическийи собственно–случайныйповторныйотбор | | |
Механическийи собственно–случайныйбесповторныйотбор | | |
Серийныйотбор приповторномотборе равновеликихсерий | | |
Серийныйотбор прибесповторномотборе равновеликихсерий | | |
Типическийотбор приповторномслучайномотборе внутригрупп, пропорциональномобъему групп | | |
Типическийотбор прибесповторномслучайномотборе внутригрупп, пропорциональ-номобъему групп | | |
где nw,nx – объемывыборок соответственнодля определенияошибок выборочнойдоли и выборочнойсредней;
rw,rx – числоотобранныхсерий соответственнодля определенияошибок выборочнойдоли и выборочнойсредней;
– предельныеошибки соответственновыборочнойдоли и выборочнойсредней.
Вариация (
)признакасуществуетобъективно,независимоот исследователя,но к началувыборочногонаблюденияона неизвестна.Для приближеннойоценки используютсяследующиеспособы:-дисперсияопределяетсяна основе результатовпроведения"пробного"обследования(обычно небольшогообъема). По даннымнесколькихпробных обследованийвыбираетсянаибольшеезначение дисперсии;
-дисперсияпринимаетсяиз предыдущихисследований;
-по правилу"трех сигм"общий размахвариации Нукладываетсяв 6 сигм, среднееквадратическоеотклонениепринимаетсяравным
Для большейточности размахделится на 5;- если хотябы приблизительноизвестна средняявеличина изучаемогопризнака, то
-при изученииальтернативногопризнака (изучениидоли), если нетдаже приблизительныхсведений о долеединиц, обладающихзаданным значениемэтого признака,принимаетсямаксимальновозможнаявеличина дисперсии,равная 0,25.
Всвязи с тем,что генеральнаядисперсияоцениваетсяприближенно,рекомендуетсярассчитанныйобъем выборкиокруглять вбольшую сторону.
Часто напрактике задаетсяне величинаабсолютнойпредельнойошибки
,а величинаотносительнойпогрешности ,выраженнаяв процентахк средней величинеоткуда
Вэтом случаеобъем выборки
Если известенкоэффициентвариации
то объем выборкиНапример,по данным пробногообследованиякоэффициентвариации составляет40%. Сколько необходимоотобрать единиц,чтобы с вероятностью0,954 предельнаяотносительнаяошибка выборкине превышала5%?
При
При серийномили типическомотборе, непропорциональномобъему групп,общее числоотбираемыхединиц делитсяна количествогрупп. Полученнаявеличина являетсяобъемом выборкииз каждой группы.
При отборе,пропорциональномчислу единицв группе, числонаблюденийпо каждой группеопределяетсяпо формуле
где nj -объемвыборки из j-й группы;
n -общийобъем выборки;
Nj -объемj-й группы;
N -объемгенеральнойсовокупности.
Приотборе с учетомвариации признака,приводящемк минимальнойошибке выборки,процент выборкииз каждой типическойгруппы долженбыть пропорционаленсреднемуквадратическомуотклонениюв этой группе.Расчет численностивыборки производитсяпо формулам:
длясредней
длядоли
4.5. Малая выборка
Под малойвыборкойпонимаетсятакое выборочноенаблюдение,численностьединиц которогоне превышает20–30 и может составлять5–6. С увеличениемчисленностивыборочнойсовокупностиповышаетсяточность выборочныхданных, однакоприходитсяиногда ограничиватьсямалым числомнаблюдений.Эта необходимостьвозникает,например, припроверке качествапродукции,связанной суничтожениемпроверяемойединицы продукции.В математическойстатистикедоказывается,что при малыхвыборкаххарактеристикивыборочнойсовокупностиможно распространятьна генеральную,но расчет среднейи предельнойошибок выборкиимеет особенности.
Ранее указывалось,что при большомобъеме выборочнойсовокупности (n> 100) коэффициент
,на которыйнеобходимоумножить выборочнуюдисперсию,чтобы получитьгенеральную,не играет большойроли. Но когдавыборочнаясовокупностьнебольшая, этоткоэффициентнеобходимопринимать вовнимание. Средняяошибка малойвыборки ( )вычисляетсяпо формулегде
– дисперсияв малой выборке,которая определяетсяследующимобразом:Предельнаяошибка имеетвид
Значениекоэффициентадоверия
зависит нетолько от заданнойдоверительнойвероятности,но и от численностиединиц выборки n . Английскийученый Стьюдентдоказал, чтов случаях малойвыборки действуетособый законраспределениявероятности.В табл.4.4 приводятсязначения,характеризующиевероятность( )того, что предельнаяошибка малойвыборки непревысит –кратнуюсреднюю ошибку:Таблица 4.4
Распределениевероятности
в малых выборкахв зависимостиот значениякоэффициента
и численностивыборкиn | |||||||
5 | 7 | 10 | 12 | 16 | 18 | 20 | |
1,0 1,5 2,0 2,5 3,0 | 0,626 0,792 0,884 0,933 0,960 | 0,644 0,816 0,908 0,953 0,976 | 0,657 0,832 0,923 0,966 0,985 | 0,662 0,838 0,930 0,970 0,988 | 0,666 0,846 0,936 0,975 0,991 | 0,668 0,848 0,938 0,977 0,992 | 0,670 0,850 0,940 0,978 0,993 |
Статистическаяпроверка гипотез
ЕфимоваМ.Р., ПетроваЕ.В., РумянцевВ.Н. Общая теориястатистики:
Учебник. М.:ИНФРА-М, 1998. - 416 с.(стр.182-203)
1.Выбор критическойобласти. Критериисогласия.
2.Проверка гипотезыо принадлежности"выделяющихся"наблюденийисследуемойгенеральнойсовокупности.
3.Проверка гипотезыо величинесредней арифметическойи доли.
4.Проверка гипотезыо расхождениидвух выборочныхдисперсий(дисперсионныйанализ).
ЛИТЕРАТУРА
1. БогородскаяН.А. Статистика.Методы анализастатистической
информации:Текст лекций.СПб.: СПГААП. - 1997. - 80 с.
2. Ефимова М.Р.,Петрова Е.В.,Румянцев В.Н.Общая теориястатистики:
Учебник. М.:ИНФРА-М, 1998. - 416 с.
3. Статистика:Курс лекций/Харченко Л.П.,ДолженковаВ.Г., Ионин В.Г.и
др.;Под ред. В.Г.Ионина.- Новосибирск:Изд-во НГАЭиУ,1996. - 310 с.
4. Общая теориястатистики:Статистическаяметодологияв изучении
коммерческойдеятельности.Учебник /А.И.Харламов,О.Э.Башина,
В.Т.Бабурини др.; Под ред.А.А.Спирина,О.Э.Башиной.М.: Финансы
статистика,1994. - 296 с.
5. Гусаров В.М.Теория статистики.- М.: Аудит, 1998. - 247 с.
6. Елисеева И.И.,М.М.Юзбашев.Общая теориястатистики.- М.: Финансы и
статистика,1998. - 367 с.
7. Теория статистики.Учебник/Подред.Р.А.Шмойловой.- М.: Финансы и
статистика,1998. - 576 с.
8. Ряузов Н.Н. Общаятеория статистики:Учебник длястудентовэкономич.
спец. вузов. -4-е изд., перераб.и дополн. М.: Финансыи статистика,1984.
-343 с.
9. Общая теориястатистики/ Под ред.ГольбергаА.М., КозловаВ.С. - М.:
Финансы истатистика,1986. - 367 с.
10.Общая теориястатистики/ Под ред.БоярскогоА.Я., ГромыкоГ.Л.. М.:
Изд-во МГУ,1985. - 326 с.
11.Практикум потеории статистики:Учебное пособие./Под ред.
Р.А.Шмойловой.- М.: Финансы истатистика,1998. 416 с.
12.Сборник задачпо общей теориистатистики:Учебное пособиедля
студентоввузов, обучающихсяпо специальности“Статистика”/
ОвсиенкоВ.Е., ГоловановаН.В., КоролевЮ.Г. и др., -2-е изд.,перераб. и
дополн. М.:Финансы и статистика,1986. - 191 с.
13.Практикум пообщей теориистатистики/Под ред. РяузоваН.Н. - 2-е изд.,
перераб.идополн. М.: Финансыи статистика,1981. - 278 с.
14. ВайнбергДж., ШумекерДж. Статистика.М.: Статистика,1979. 389 с.
15. ВенецкийИ.Г., ВенецкаяВ.И. Основныематематико–статистическиепонятия и формулыв экономическоманализе. М.:Статистика,1974. 278 с.
16. Кейн Э. Экономическаястатистикаи эконометрия.М.: Статистика,1977. 229 с.
Приложение
Таблицаслучайных чисел
5489 | 5583 | 3156 | 0835 | 1988 | 3912 | 0938 | 7460 | 0869 | 4420 |
3522 | 0935 | 7877 | 5665 | 7020 | 9555 | 7375 | 7124 | 7878 | 5544 |
7555 | 7579 | 2550 | 2487 | 9477 | 0864 | 2349 | 1012 | 8250 | 2633 |
5759 | 3554 | 5080 | 9074 | 7001 | 6249 | 3224 | 6368 | 9102 | 2672 |
6303 | 6895 | 3371 | 3196 | 7231 | 2918 | 7380 | 0438 | 7547 | 2644 |
7351 | 5634 | 5323 | 2623 | 7803 | 8374 | 2191 | 0464 | 0696 | 9529 |
7068 | 7803 | 8832 | 5119 | 6350 | 0120 | 5026 | 3684 | 5657 | 0304 |
3613 | 1428 | 1796 | 8447 | 0503 | 5654 | 3254 | 7336 | 9536 | 19441 |
5143 | 4534 | 2105 | 0368 | 7890 | 2473 | 4240 | 8652 | 9435 | .1422 |
9815 | 5144 | 7649 | 8638 | 6137 | 8070 | 5345 | 4865 | 2456 | 5708 |
5780 | 1277 | 6816 | 1013 | 2867 | 9938 | 3930 | 3203 | 5696 | 1769 |
1187" | 0951 | 5991 | 5245 | 5700 | 5564 | 7352 | 0891 | 6249 | 6568; |
4184 | 2179 | 4554 | 9083 | 2254 | 2435 | 2965 | 5154 | 1209 | 7069 |
2916 | 2972 | 9885 | 0275 | 0144 | 8034 | 8122 | 3213 | 7666 | 0230 |
5524 | 1341 | 9860 | 6565 | 6981 | 9842 | 0171 | 2284 | 2707 | 3008 |
0146 | 5291 | 2354 | 5694 | 0377 | 5336 | 6460 | 9585 | 3415 | 2358 |
4920 | 2826 | 5238 | 5402 | 7937 | 1993 | 4332 | 2327 | 6875 | 5230 |
7978 | 1947 | ,6380 | 3425 | 7267 | 7285 | 1130 | 7722 | 0164 | 8573 |
7453 | 0653 | 3645 | 7497 | 5969 | 8682 | 4191 | 2976 | 0361 | 9334 |
1473 | 6938 | 4899 | 5348 | 1641 | 3652 | 0852 | 5296 | 4538 | 4456 |
8162 | 8797 | 8000 | 4707 | 1880 | 9660 | 8446 | 1883 | 9768 | 0881 |
5645 | 4219 | 0807 | 3301 | 4279 | 4168 | 4305 | 9937 | 3120 | 5547 |
2042 | 1192 | 1175 | 8851 | 6432 | 4635 | 5757 | 6656 | 1660 | 5389 |
5470 | 7702 | 6958 | 9080 | 5925 | 8519 | 0127 | 9233 | 2452 | 7341 |
4045 | 1730 | 6005 | 1704 | 0345 | 3275 | 4738 | 4862 | 2556 | 8333 |
5880 | 1257 | 6163 | 4439 | 7276 | 6353 | 6912 | 0731 | 9033 | 5294 |
9083 | 4260 | 5277 | 4998 | 4298 | 5204 | 3965, | 4028 | 8936 | 5148 |
1762 | 8713 | 1189 | 1090 | 8989 | 7273 | 3213 | 1935 | 9321 | 4820 |
2023 | 2589 | 1740 | 0424 | 8924 | 0005 | 1969 | 1636 | 7237 | 1227 |
7965 | 3855 | 4765 | 0703 | 1678 | 0841 | 7543 | 0308 | 9732 | 1289 |
7690 | 0480 | 8098 | 9629 | 4819 | 7219 | 7241 | 5128 | 3853 | 1921 |
9292 | 0426 | 9573 | 4903 | 5916 | 6576 | 8368 | 3270 | 6641 | 0033 |
0867 | 1656 | 7016 | 4220 | 2533 | 6345 | 8227 | 1904 | 5138 | 2537 |
0505 | 2127 | 8255 | 5276 | 2233 | 3956 | 4118 | 8199 | 6380 | 6340 |
6295 | 9795 | 1112 | 5761 | 2575 | 6837 | 3336 | 9322 | 7403 | 8345 |
6323 | 2615 | 3410 | 3365' | 1117 | 2417 | 3176 | 2434 | 5240 | 5455 |
8672 | 8536 | 2966 | 5773 | 5412 | 8114 | 0930 | 4697 | 6919 | 4569 |
1422 | 5507 | 7596 | 0670 | 3013 | 1351 | 3886 | 3268 | 9469 | 2584 |
2653 | 1472 | 5113 | 5735 | 1469 | 9545 | 9331 | 5303 | 9914 | 6394 |
0438 | 4376 | 3328 | 8649 | 8327 | 0110 | 4549 | 7955 | 5275 | 2890 |
2851 | 2157 | 0047 | 7085 | 1129 | 0460 | 6821 | 8323 | 2572 | 8962 |
7962 | 2753 | 3077 | 8718 | 7418 | 8004 | 1425 | 3706 | 8822 | 1494 |
3837 | 4098 | 0220 | 1217 | 4732 | 0150 | 1637 | 1097 | 1040 | 7372 |
8542 | 4126 | 9274 | 2251 | 0607 | 4301 | 8730 | 7690 | 6235 | 3477 |
0139 | 0765 | 8039 | 9484 | 2577 | 7859 | 1976 | 0623 | 1418 | 6685 |
6687 | 1943 | 4307 | 0579 | 8171 | 8224 | 8641 | 7034 | 3595 | 3875 |
6242 | 5582 | 5872 | 3197 | 4919 | 2792 | 5991 | 4058 | 9769 | 1918 |
6859 | 9606 | 0522 | 4993 | 0345 | 8958 | 1289 | 8825 | 6941 | 7685 |
6590 | 1932 | 6043 | 3623 | 1973 | 4112 | 1795 | 8465 | 2110 | 8045 |
3482 | 0478 | 0221 | 6738 | 7323 | 5643 | 4767 | 0106 | 2272 | 9862 |
МИНИСТЕРСТВООБЩЕГО И ПРОФЕССИОНАЛЬНОГООБРАЗОВАНИЯ
РОССИЙСКОЙФЕДЕРАЦИИ
Санкт-Петербургскийгосударственныйуниверситет
аэрокосмическогоприборостроения
СТАТИСТИКА
Выборочныенаблюдения
Методическиеуказания кпрактическимзанятиям
Санкт-Петербург
1999
Составитель Н.А. Богородская
Рецензенткандидатэкономическихнаук доцентЛ.Г.Фетисова
Методическиеуказания кпрактическимзанятиямпредназначеныдля студентов,изучающихдисциплину"Статистика",обучающихсяпо направлениюи специальности521500 и 061100 "Менеджмент"и по экономическимспециальностями направлениям071900, 060400, 060500, 522300 всех формобучения.
В работеприведеныметодическиеуказания крешению задачпо теме "Выборочныенаблюдения"и рассмотреныпримеры решениязадач для различныхвидов отбора:механического,собственно-случайного,серийного итипическогопри повторнойи бесповторнойвыборке единициз статистическойсовокупности.
С Санкт-Петербургский
государственныйуниверситет
аэрокосмического
приборостроения,1999
ЛицензияЛР №020341 от 07.05.97
Подписанок печати Формат 60ґ841/16 Бумага тип.№ 3.
Печатьофсетная. Усл.печ.л. 1,86 Уч.-изд.л. 2,0 Тираж 100 экз. Заказ №
Редакционно-издательскийотдел
Отдел оперативнойполиграфии
СПбГУАП
190000, Санкт-Петербург,ул. Б. Морская,67
1. МЕТОДИЧЕСКИЕУКАЗАНИЯ КРЕШЕНИЮ ЗАДАЧПО ТЕМЕ "ВЫБОРОЧНЫЕ НАБЛЮДЕНИЯ"
1.1. Выборочное исследование
При статистическомисследованииэкономическихявлений могутприменятьсявыборочныенаблюдения,при которыххарактеристикигенеральнойсовокупностиполучаютсяна основанииизучения частигенеральнойсовокупности,называемойвыборочнойсовокупностьюили выборкой.
Выборочноенаблюдение (выборочноеисследование)заключаетсяв обследованииопределенногочисла единицсовокупности,отобранного,как правило,случайнымобразом. Привыборочномметоде обследованиюподлежит сравнительнонебольшая частьвсей изучаемойсовокупности(обычно до 5–10%,реже до 15–20%). Отборединиц из генеральнойсовокупностипроизводитсятаким образом,чтобы выборочнаясовокупностьбыла представительна
(репрезентативна)и характеризовалагенеральнуюсовокупность.Степень представительностивыборки зависитот способаорганизациивыборки и отее объема. Полнойрепрезентативностивыборки достичьне удается.Поэтому необходимаоценка надежностирезультатоввыборки и возможностиих распространенияна генеральнуюсовокупность.
В основетеории выборочногонаблюдениялежат теоремызаконов большихчисел, которыепозволяютрешить двавзаимосвязанныхвопроса выборки:рассчитатьее объемпри заданнойточности исследованияи определитьошибкупри данномобъеме выборки.
При использованиивыборочногометода обычноиспользуютсядва вида обобщающихпоказателей:относительнуювеличинуальтернативногопризнакаи среднюювеличинуколичественногопризнака.
Относительнаявеличинаальтернативногопризнакахарактеризуетдолю (удельныйвес) единиц встатистическойсовокупности,обладающихизучаемымпризнаком. Вгенеральнойсовокупностиэта доля единицназываетсягенеральнойдолей (p),а в выборочнойсовокупности– выборочнойдолей (w).
Средняявеличинаколичественногопризнака вгенеральнойсовокупностиназываетсягенеральнойсредней(
),а в выборочнойсовокупности– выборочнойсредней( ).1.2. Виды отборапри выборочном наблюдении
Процессобразованиявыборки называетсяотбором,который осуществляетсяв порядкебеспристрастного,случайногоотбора единициз генеральнойсовокупности.
Существуютразличныеспособы отбора:индивидуальный,групповой(серийный),комбинированный, повторный(возвратный),бесповторный(безвозвратный),одноступенчатый,многоступенчатый,собственно-случай-ный,механическийи типическийотбор.
При индивидуальномотборе ввыборку отбираютсяотдельныеединицы совокупности.Отбор повторяетсястолько раз,сколько необходимоотобрать единиц.
Групповой(серийный) отборзаключаетсяв отборе серий(например, отборизделий дляпроверки ихцелыми партиями).Если обследованиюподвергаютсявсе единицыотобранныхсерий, отборназываетсясерийным,а если обследуетсятолько частьединиц каждойсерии, отбираемыхв индивидуальнымпорядке изсерии, то –комбинированным.
Если в процессеотбора отобраннаяединица неисключаетсяиз совокупности,т.е. возвращаетсяв совокупность,и может бытьповторно отобранной,то такой отборназываетсяповторнымили возвратным,в противномслучае – бесповторнымили безвозвратным.Серийный отбор,как правило,безвозвратный.
При одноступенчатомотбираютсяединицы совокупности(или серии)непосредственнодля наблюдения.При многоступенчатомотбираютсясначала крупныесерии единиц(первая ступеньотбора), наблюдениюони не подвергаются.Затем из нихотбираютсясерии, меньшиепо численностиединиц (втораяступень), наблюдениюне подвергаются,и так до техпор, пока небудут отобраныте единицысовокупности(серии), которыебудут подвергнутынаблюдению.
Собственно-случайныйотбор состоитв отборе единиц(серий) из всейгенеральнойсовокупностив целом посредствомжеребьевкиили наоснованиитаблицслучайныхчисел.
Механическийотборзаключаетсяв том, что составляетсясписок единицгенеральнойсовокупностии в зависимостиот числа отбираемыхединиц (серий)устанавливаетсяшаг отбора,т.е. через какойинтервал следуетбрать для наблюденияединицы (серии).Например, впростейшемслучае, при 10%–м отборе,отбираетсякаждая десятаяединица поэтому списку,т.е. если первойвзята единица № 1, то следующимиотбираются11–я, 21–я и т.д. Втакой последовательностипроизводитсяотбор, еслиединицы совокупностирасположеныв списке безучета их “рангов”,т.е. значимостипо изучаемымпризнакам.Начало отборав этом случаене имеет значения,его можно начатьв приведенномпримере отлюбой единицыиз первогодесятка. Прирасположенииединиц совокупностив ранжированномпорядке заначало отборадолжна бытьпринята серединаинтервала (шагаотбора) во избежаниесистематическойошибки выборки.
При типическомотборегенеральнаясовокупностьразбиваетсяна типическиегруппы единицпо какому–либопризнаку, азатем из каждойиз них производитсямеханическийили собственно-случайныйотбор. Отборединиц из типовпроизводитсятремя методами:пропорциональночисленностиединиц типическихгрупп, непропорциональночисленностиединиц типическихгрупп и пропорциональноколеблемостив группах.
1.3. Ошибки выборочного отбора
Расхождениемежду значениямиизучаемогопризнака выборочнойи генеральнойсовокупностейявляется ошибкой репрезентативности(представи–тельности).Она может бытьслучайной исистематической.Случайнаявозникает всилу того, чтовыборочноестатистическоенаблюдениеявляется несплошнымнаблюдением,и выборканедостаточноточно воспроизводит(репрезентирует)генеральнуюсовокупность.При определениивеличинырепрезентативнойошибки предполагается,что ошибкарегистрацииравна нулю.Определениеошибки производитсяпо формуламошибки выборочнойдоли и ошибкивыборочнойсредней.
1.3.1. Ошибка выборочной доли
Выборочнаядоля представляетсобой отношениечисла единиц,обладающихданным признакомили данным егозначением ( m), к общему числуединиц выборочнойсовокупности ( n )
(Эту статистическуюхарактеристикуне следуетпутать с долейвыборки, являющейсяотношениемчисла единицвыборочнойсовокупностик числу единицгенеральнойсовокупности).
Ошибкавыборочнойдоли представляетсобой расхождение(разность) междудолей в выборочнойсовокупности ( w )и долей в генеральнойсовокупности ( p ),возникающеевследствиенесплошногохарактеранаблюдения.Величина ошибкивыборочнойдоли определяетсякак пределотклоненияw от p ,гарантируемыйс заданнойвероятностью:
где
– гарантийныйкоэффициент,зависящий отвероятности , с которойгарантируетсяневыход разности w –p за пределы ; – средняя ошибкавыборочнойдоли.Значениягарантийногокоэффициента
и соответствующиеим вероятности приведеныв табл.1.1.Обычно вероятностьпринимаетсяравной 0,9545 или0,9973, а при этом равносоответственно2 и 3.Значениясредней ошибкивыборки определяютсяпо формуле
где
– дисперсияв генеральнойсовокупности.Между дисперсиямив генеральнойи выборочнойсовокупностяхсуществуетследующеесоотношение:
где
–дисперсия ввыборке.Таблица 1.1
Значениягарантийногокоэффициента
1,00 1,10 1,20 1,30 1,40 1,50 1,60 | 0,6827 0,7287 0,7699 0,8064 0,8385 0,8664 0,8904 | 1,70 1,80 1,90 2,00 2,10 2,20 2,30 | 0,9109 0,9281 0,9426 0,9545 0,9643 0,9722 0,9786 | 2,40 2,50 2,60 2,70 2,80 2,90 3,00 | 0,9836 0,9876 0,9907 0,9931 0,9949 0,9963 0,9973 |
Если n достаточновелико, то
близко к единицеи дисперсиюв генеральнойсовокупностиможно заменитьна дисперсиюв выборке.Средняяошибка выборочнойдоли определяетсяпо формуле
где
– дисперсиявыборочнойдоли.Для показателядоли альтернативногопризнака (выборочнойдоли) дисперсияопределяетсяпо формуле
Приведеннаяформула среднейошибки выборочнойдоли применяетсяпри повторномотборе.
При бесповторномотборе численностьгенеральнойсовокупностисокращается,поэтому дисперсияумножаетсяна коэффициент
Формулы расчетасредних ошибоквыборочнойдоли для различныхспособов отбораединиц из генеральнойсовокупностиприведены втабл. 1.2.Таблица 1.2
Формулырасчета среднихошибок выборочнойдоли
и выборочнойсредней
Методотбора выборки | Средняяошибка | |
выборочнойдоли | выборочнойсредней | |
Механическийи собственно–случайныйповторный | | |
Механическийи собственно–случайныйбесповторный | | |
Серийныйпри бесповторномотборе серий | ||
Типическийпри повторномслучайномотборе внутригрупп | | |
Типическийпри бесповторномслучайномотборе внутригрупп | | |
где N – численностьгенеральнойсовокупности;
– межсерийнаядисперсиявыборочнойдоли;
r – число отобранныхсерий;
R – число серийв генеральнойсовокупности;
– средняяиз групповыхдисперсийвыборочнойдоли;
– дисперсияпризнака x ;
– межсерийнаядисперсиявыборочныхсредних;
– средняяиз групповыхдисперсийвыборочнойсредней.
Дисперсиив формулахрасчета среднихошибок выборочнойдоли в табл.1.2определяетсяследующимобразом:
– межсерийнаядисперсиявыборочнойдоли
где wj – выборочнаядоля в j -й серии;
– средняявеличина доливо всех сериях;
–средняя изгрупповыхдисперсий
где wj – выборочнаядоля в j -й типическойгруппе;
nj – числоединиц в j -й типическойгруппе;
k – число типическихгрупп.
Предельноезначение ошибкивыборочнойдоли определяетсяпо следующейформуле:
Величинасредней ошибкивыборочнойдоли
зависитот доли изучаемогопризнака вгенеральнойсовокупности,числа наблюденийи способа отбораединиц из генеральнойсовокупностидля наблюдения,а величинапредельнойошибки зависит ещеи от величинывероятности ,с которойгарантируютсярезультатывыборочногонаблюдения.Распространениевыборочныхданных на генеральнуюсовокупностьпроизводитсяс учетом доверительныхинтервалов.Доля альтернативногопризнака вгенеральнойсовокупностиравна
1.3.2. Ошибка выборочной средней
Ошибкавыборочнойсредней представляетсобой расхождение(разность) междувыборочнойсредней
и генеральнойсредней ,возникающеевследствиенесплошноговыборочногохарактеранаблюдения.Величина ошибкивыборочнойсредней определяетсякак пределотклонения от ,гарантируемыйс заданнойвероятностью:где
– средняя ошибкавыборочнойсредней.При повторномотборе средняяошибка определяетсяследующимобразом:
где
– средняя величинадисперсииколичественногопризнака ,которая рассчитываетсяпо формулесредней арифметическойневзвешеннойилисредней арифметическойвзвешенной
где fi – статистическийвес.
Формулырасчета среднейошибки выборочнойсредней дляразличныхспособов отборавыборочнойсовокупностиприведены втабл.1.2.
Межсерийнаядисперсиявыборочныхсредних
и средняя извыборочныхдисперсийтипическихгрупп вычисляютсяследующимобразом:где
– среднее значениепоказателя в j- й серии;–дисперсияпризнака x в j- й типическойгруппе;
nj – числоединиц в j - й типическойгруппе.
Предельнаяошибка выражаетсяследующимобразом:
и зависитот вариацииизучаемогопризнака вгенеральнойсовокупности,объема и доливыборки, способаотбора единициз генеральнойсовокупностии от величинывероятности,с которойгарантируютсярезультатывыборочногонаблюдения.
Средняявеличинаколичественногопризнака вгенеральнойсовокупностиопределяетсяс учетом предельнойошибки выборочнойсредней
4.4. Объем выборки
Определениенеобходимого объемавыборки n основываетсяна формулахпредельныхошибок выборочнойдоли и выборочнойсредней. Например,для повторногоотбора предельныеошибки равны
отсюда объемывыборок длярасчета выборочнойдоли nw и выборочнойсредней nx следующие:
Аналогичнымобразом определяютсяобъемы выборокпри различныхспособах отборавыборочнойсовокупности.Для серийногоотбора определяетсячисло отобранныхсерий. Формулырасчета приведеныв табл.1.3.
Таблица 1.3
Формулырасчета объемавыборки
Методотбора выборки | Объемвыборки иличисло серийдля определения | |
выборочнойдоли | выборочнойсредней | |
Механическийи собственно–случайныйповторный | | |
Механическийи собственно–случайныйбесповторный | | |
Серийныйпри бесповторномотборе серий | | |
Типическийпри повторномслучайномотборе внутригрупп | | |
Типическийпри бесповторномслучайномотборе внутригрупп | | |
где nw,nx – объемывыборок соответственнодля определенияошибок выборочнойдоли и выборочнойсредней;
rw,rx – числоотобранныхсерий соответственнодля определенияошибок выборочнойдоли и выборочнойсредней;
– предельныеошибки соответственновыборочнойдоли и выборочнойсредней.
2. ПРИМЕРЫРЕШЕНИЯ ЗАДАЧ
2.1. Механическийи собственно-случайныйотбор
Задача 1. В районеА проживает2500 семей. Дляпроведенияобследованиявыбрано 50 семейметодом механического(или собственно-случайного)бесповторногоотбора. В результатеобследованияполучены следующиеданные о количестведетей в семье:
Таблица 2.1
Числодетей в семье | 0 | 1 | 2 | 3 | 4 | 5 |
Количествосемей | 10 | 20 | 12 | 4 | 2 | 2 |
Определитьсреднююошибку выборочнойсреднейколичествадетей в семьеи с вероятностью0,997 пределы, вкоторых находитсясреднее количестводетей в семьев районе А.
Решение.
Средняяошибка выборочнойсредней определяетсяпо следующейформуле(см.табл.1.2):
,где n - численностьвыборки;
N - численностьгенеральнойсовокупности;
- дисперсияпризнака x .
Дисперсия
определяетсяпо формуле , а среднеевыборочноезначениеРасчетсреднего идисперсии числадетей в семьев выборочнойсовокупностиприведены втабл.2.2.
Таблица 2.2
Число детейв семье | Количествосемей | ||||
0 1 2 3 4 5 | 10 20 12 4 2 2 | 0 20 24 12 8 10 | -1,48 -0,48 +0,52 +1,52 +2,52 +3,52 | -14,8 - 9,6 +6,24 +6,08 +5,04 +7,04 | 21,9040 4,6080 3,2448 9,2416 12,7008 24,7808 |
Итого | 50 | 74 | - | 0 | 76,4800 |
Среднее числодетей в семье
чел.Дисперсиячисла детейв семье
Средняя ошибкачисла детейв выборке составит
чел.Значениювероятности0,997 соответствуетзначение гарантийногокоэффициента
Тогда предельнаяошибка выборочнойсредней чел.Значениегенеральнойсредней определяется
Пределы, вкоторых находитсясреднее числодетей в семьев районе А:
С вероятностью0,997 можно утверждать,что число детейв семьях района А колеблетсяот 0,99 до 2,01 человека( от 1 до 2 человек).
Задача 2. Методомсобственно-случайного(или механического)повторногоотбора быловзято для проверкина вес 200 штукдеталей. В результатепроверки былустановленсредний весдеталей 30 г присреднем квадратическомотклонении4 г.
Свероятностью0,954 определитьпределы,в которых находитсясреднийвес деталейв генеральнойсовокупности.
Решение.
Средняя ошибкасреднего весадеталей в выборке(выборочнойсредней)
Предельнаяошибка выборочнойсредней свероятностью0,954 (гарантийныйкоэффициент
)составитВерхняяграница генеральнойсредней
Нижняя границагенеральнойсредней
Свероятностью0,954 можно утверждать,что среднийвес деталиколеблетсяв пределах
Задача 3. Методомсобственно-случайного(или механического)бесповторногоотбора из общейчисленностиработниковпредприятия(5 тыс.чел.) былоотобрано 500работников.Установлено,что 20% работниковв выборке старше60 лет.
Определитьс вероятностью0,683 пределы, вкоторых находитсядоля работниковпредприятияв возрастестарше 60 лет.
Решение.
Средняяошибка выборочнойдоли работниковстарше 60 летопределяетсяследующимобразом (см.табл.1.2)
С вероятностью0,683 (гарантийныйкоэффициент
)предельнаяошибка выборочнойдоли работниковстарше 60-ти летсоставитВерхняяграница генеральнойдоли
Нижняя границагенеральнойдоли
С вероятностью0,683 можно утверждать,что доля работниковв возрастестарше 60 летна предприятииколеблетсяот 18,3% до 21,7%.
Задача 4. При обследовании100 изделий, отобранныхиз партии методоммеханического(или собственно-случайного)повторногоотбора, 10 изделийоказалисьдефектными.
Определитьс вероятностью0,866 пределы, вкоторых находитсядоля дефектныхизделийв партии.
Решение.
Для дефектнойпродукции ввыборочнойсовокупности
Средняяошибка выборочнойдоли дефектныхизделий равна(см.табл.1.2)
Предельнаяошибка выборочнойдоли с вероятностью0.866 (гарантийныйкоэффициент
)составитС вероятностью0,866 можно утверждать,что доля дефектнойпродукции впартии колеблетсяот 5,5% до 14,5%.
Задача 5. В районе А проживает2000 семей. Предполагаетсяопределитьсредний размерсемьи в районепо выборке,взятой методоммеханического(или собственно-случайного)бесповторногоотбора. Приэтом с вероятностью0,997 ошибка среднегоразмера семьив выборке (выборочнойсредней) недолжна превышать0,8 человека присреднем квадратическомотклонениив размере семьи2 человека.
Определитьнеобходимуючисленностьвыборкидля определениясреднегоразмера семьив районе.
Решение.
Необходимаячисленностьвыборки (см.табл.1.3)при вероятности0,997 (гарантийныйкоэффициент
)определяетсяследующимобразом: семей.Проверка. Средняя ошибкасреднего размерасемьи составляет
чел.Предельнаяошибка выборочнойсредней привероятности0,997 (
) чел. не превышаетзаданной ошибки0,8 чел.Задача 6. Для определениясредней длиныдетали необходимопровести выборочноеобследованиеметодом случайного(или механического)повторногоотбора.
Определить,какое количестводеталей необходимоотобрать(числен-ностьвыборки),чтобы ошибкавыборки (ошибкавыборочнойсредней)не превышала2 мм с вероятностью0,988 при среднемквадратическомотклонении8 мм.
Решение.
Необходимаячисленностьвыборки в случаеповторногособственно-случайного(или механического)отбора (см.табл.1.3)при вероятности0,997 (гарантийныйкоэффициент
)определяетсяследующимобразом: деталей.Проверка. Средняя ошибкасредней длиныдетали составляет
мм.Предельнаяошибка выборочнойсредней привероятности0,988 (
) составляет мм, что соответствуетусловию задачи.Задача 7. В городеА имеется 10тыс.семей. Сиспользованиемметода выборочныхнаблюденийпредполагаетсяопределитьдолю семей счислом детейтри и более.
Определитьчисленностьвыборки,чтобы примеханическом(или собственно-случайном)отборе с вероятностью0,954 ошибка выборки(доли семейс числом детейтри и более) непревышала 0,02,если на основепредыдущихобследованийизвестно, чтодисперсия равна0,2.
Решение.
Необходимаячисленностьвыборки дляопределениядоли семей счислом детейтри и более(см.табл.1.3) привероятности0,954 (гарантийныйкоэффициент
)определяетсядля бесповторногоотбора
семей;дляповторногоотбора
семей.Задача 8. Для изученияоснащения 500предприятийосновнымипроизводственнымифондами былопроведено 10%-евыборочноеобследованиеметодомсобственно-случайного(или механического)отбора, в результатекоторого полученыследующиеданные о распределениипредприятийпо стоимостиосновныхпроизводственныхфондов:
Таблица 2.3
Среднегодоваястоимостьосновныхпроизводственныхфондов, млнр. | До20 | 20-40 | 40-60 | Свыше 60 | Итого: |
Числопредприятий | 5 | 12 | 23 | 10 | 50 |
Определить:
- с вероятностью0,997 предельнуюошибку выборочнойсредней и границы,в которых будетнаходитьсясреднегодоваястоимостьосновныхпроизводственныхфондов всехпредприятийгенеральнойсовокупности;
- с вероятностью0,954 предельнуюошибку выборкипри определениидоли и границы,в которых будетнаходитьсяудельный веспредприятийсо стоимостьюосновныхпроизводственныхфондов свыше40 млн р.;
- объемывыборочнойсовокупностипри условии,что:
предельнаяошибка выборкипри определениисреднегодовойстоимостиосновныхпроизводственныхфондов с вероятностью0,997 была бы неболее 5 млн р.;
предельнаяошибка долипредприятийсо стоимостьюосновныхпроизводственныхфондов свыше40 млн р. с вероятностью0,954 была бы неболее 15%.
Решение.
Для определенияграниц генеральнойсредней необходимовычислитьсреднюю выборочную
и дисперсию , расчет которыхприведен втабл.2.3.Тогда
млн р.;Таблица 2.4
Среднегодоваястоимостьосновныхпроизводственныхфондов, млнр. | Числопред-прия-тий | Сере-динаинтер-вала,млн р. | | | | |
До 20 20 - 40 40 - 60 Свыше60 | 5 12 23 10 | 10 30 50 70 | 50 360 1150 700 | -35,2 -15,2 4,8 24,8 | -176,0 -182,4 110,4 248,0 | 6195,20 2772,48 529,92 6150,04 |
Итого | 50 | - | 2260 | - | 0 | 15647,64 |
Для упрощениярасчета среднейи дисперсииможно использоватьспособ моментов.
При следующихисходных данных: N=500; n =50;
средняяошибка выборкипри определениисреднегодовойстоимостиосновных фондовсоставит:при повторномотборе
при бесповторномотборе
При определениисреднегодовойстоимостиосновныхпроизводственныхфондов в среднемна одно предприятиев выборочнойсовокупностисредняя ошибкавыборки (ошибкарепрезентативности)при повторномотборе составляет2,5 млн р., прибесповторном- 2,37.
Предельнаяошибка выборочнойсредней свероятностью0,997 (гарантийныйкоэффициент
)составитпри повторномотборе
при бесповторномотборе
Значениегенеральнойсредней определяется
Пределы, вкоторых находитсясреднее числодетей в семьев районе А:
Среднегодоваястоимостьосновныхпроизводственныхфондов в среднемна одно предприятиегенеральнойсовокупностинаходится вследующихпределах:
при повторномотборе
млн.р или ;при бесповторномотборе
Эти границыможно гарантироватьс вероятностью0,997.
Вычислениепределов приустановлениидоли осуществляетсяаналогичнонахождениюпределов длясредней величины
где p-доля единицв генеральнойсовокупности,обладающихданным признаком.
Доля предприятийв выборочнойсовокупностисо среднегодовойстоимостьюосновныхпроизводственныхфондов свыше40 млн р. составляет
Предельнаяошибка долис вероятностью0,954 (гарантийныйкоэффициент
):при повторномотборе
при бесповторномотборе
С вероятностью0,954 доля предприятийсо среднегодовойстоимостьюосновныхпроизводственныхфондов свыше40 млн р. в генеральнойсовокупностинаходится впределах:
при повторномотборе
при бесповторномотборе
При бесповторномотборе ошибкавыборки меньше,чем при тех жеусловиях приповторнойвыборке.
Объем выборкидля расчетаошибки среднейпри N=500; n =50;
; млнр. с вероятностью0,997 (гарантийныйкоэффициент )при повторномотборе
предпр.;при бесповторномотборе
Объем выборкидля расчетаошибки долипри N=500; n =50;
; с вероятностью0,954 (гарантийныйкоэффициент )при повторномотборе
при бесповторномотборе
2.2. Серийныйотбор
Задача 1. В одномиз цехов предприятияв десяти бригадахработает 100 рабочих.В целях изученияквалификациирабочих былапроведена 20%-ясерийная бесповторнаявыборка, в которуювошли 2 бригады.Получено следующеераспределениеобследованныхрабочих поразрядам:
Таблица 2.5
Номер | Разрядырабочих | |
рабочего | вбригаде 1 | вбригаде 2 |
1 2 3 4 5 6 7 8 9 10 | 2 4 5 2 5 6 5 8 4 5 | 3 6 1 5 3 4 2 1 3 2 |
Определитьс вероятностью0,997 предел, в которомнаходитсясреднийразрядрабочих цеха.
Решение.
Средняяошибкавыборочнойсредней (см.табл.1.2)определяетсяпо следующейформуле:
где
– межсерийнаядисперсиявыборочныхсредних;R – числосерий в генеральнойсовокупности;
r – числоотобранныхсерий.
Для определениямежсерийной(межгрупповой)дисперсиивыборочныхсредних необходиморассчитатьгрупповые иобщую среднюювеличину.
Среднийразряд:
в первойбригаде
разр.вовторой бригаде
разр.Средний разрядрабочего в двухбригадах (общаясредняя)
разр.Межсерийная(межгрупповая)дисперсия
где
– среднее значениепоказателя в j– й серии (группе);– среднеезначение показателяво всех сериях(общая средняя).
Средняяошибка среднегоразряда рабочегов двух бригадах(выборочнойсредней)
разр.Значениювероятности0,997 соответствуетзначение гарантийногокоэффициента
Тогда предельнаяошибка выборочнойсредней разр.С вероятностью0,997 можно утверждать,что среднийразряд рабочихцеха находитсяв пределах
Задача 2. Деталиупакованы в200 ящиков по 40деталей в каждый.Для проверкикачества деталейбыл проведенсплошной контрольдеталей в 20 ящиках(10%-й серийныйбесповторныйотбор). В результатеконтроля установлено,что доля бракованныхдеталей составляет15%. Межсерийнаядисперсия равна0,002.
С вероятностью0,954 определитьпределы, в которыхнаходится долябракованнойпродукцииво всей партииящиков.
Решение.
Средняя ошибкавыборочнойдоли (см.табл.1.2)
где
– межсерийнаядисперсиявыборочнойдоли.Предельнаяошибка выборочнойдоли (долибракованныхдеталей в выборке)с вероятностью0,954 (гарантийныйкоэффициент
)составитС вероятностью0,954 можно утверждать,что доля дефектнойпродукции впартии (в 200 ящиках)находится впределах
Задача 3. В механическомцехе предприятияимеется 10 бригадпо 20 рабочих вкаждой бригаде.Для установленияквалификации(среднего разряда)рабочих цехаиспользуетсяметод серийногобесповторногоотбора.
Определитьнеобходимоеколичествобригад,чтобы с вероятностью0,997 ошибка выборки(среднийразрядрабочего вцехе) не превышалаодного разряда.На основе предыдущихисследованийизвестно, чтомежсерийнаядисперсия равна0,9.
Решение.
С вероятностью0,997 (гарантийныйкоэффициент
)численностьвыборочнойсовокупности(число отобранныхбригад) определяетсяследующимобразом (см.табл1.3): бр.Задача 4. На предприятииработает 200 бригадс одинаковойчисленностьюрабочих. Дляизучения долирабочих, выполняющихнорму выработки,используетсяметод серийногобесповторногоотбора.
Определитьнеобходимуючисленностьвыборки,чтобы с вероятностью0,954 предельнаяошибка выборки(предельнаяошибкадоли рабочих,выполняющихнорму выработки)не превышала5%, если межсерийнаядисперсиявыборочнойдоли равна2,25.
Решение.
Необходимаячисленностьвыборкидля изучениявыборочнойдоли (см.табл.1.3)с вероятностью0,954 (гарантийныйкоэффициент
)равна бр.Задача 5. Для определениясредней наработкидо отказа 1000приборов,распределенныхна партии (серии)по 10 шт., проводитсясерийная 4%-ябесповторнаявыборка. Результатыиспытанийотобранныхприборовхарактеризуютсяследующимиданными:
Таблица 2.6
Показатели | Номерпартии приборов | |||
1 | 2 | 3 | 4 | |
Средняянаработкадо отказа, тыс.ч Доляприборов снаработкойдо отказа неменее 12 тыс.ч | 10 0,80 | 12 0,85 | 15 0,90 | 18 0,95 |
Определить:
1) средниеошибки репрезентативности:
- наработкиприборов доотказа;
- удельноговеса приборовс наработкойдо отказа неменее 12 тыс.ч;
2) с вероятностью0,954 пределы, вкоторых будетнаходиться:
- средняянаработка доотказа всехприборов;
- доля приборовв генеральнойсовокупности,наработка доотказа которыхне менее 12 тыс.ч;
3) вероятностьтого, что
- предельнаяошибка выборкипри установлениисредней наработкидо отказа непревысит 1,0 тыс.ч;
- доля приборовс наработкойдо отказа неменее 12 тыс.чбудет находитьсяв пределах от83% до 92%.
Решение.
1. Прибесповторномотборе серийсредняя ошибкарепрезентативностиопределяетсяпо формулам(см.табл.1.3) соответственнодля среднейи для доли
где r – числоотобранныхсерий;
R – число серийв генеральнойсовокупности;
– межсерийнаядисперсиявыборочныхсредних;
– межсерийнаядисперсиявыборочнойдоли.
Средняянаработка доотказа приборовв отобранных4 партиях
Среднийудельный весприборов снаработкойдо отказа неменее 12 тыс.ч
Межсерийнаядисперсия длясредней и длядоли определяетсяпо формулам
Расчет приведенв табл.2.7
Таблица 2.7
Но-мерпартии | Средняянаработка доотказа, тыс.ч | | | Доляприборовс наработкойдо отказа неменее 12 тыс. ч, | | |
1 2 3 4 | 10 12 15 18 | -3,75 -1,75 1,25 4,25 | 14,06 3,06 1,56 18,06 | 0,80 0,85 0,90 0,95 | -0,075 -0,025 0,025 0,075 | 0,005625 0,000625 0,000625 0,005625 |
0 | 36,74 | 0,012500 |
Тогда межсерийныедисперсии
Средние ошибкирепрезентативности:
-при определениисредней -
тыс. ч;-при определениидоли -
2. С вероятностью0,954 (гарантийныйкоэффициент
)предельныеошибки репрезентативностидля среднейи для доли: тыс. ч;Средняянаработка доотказа всех1000 приборовнаходится впределах
тыс. ч илиСреднийудельный весприборов снаработкойдо отказа неменее
12 тыс. ч в генеральнойсовокупностибудет находитьсяв пределах
или3. Средняяошибка среднейнаработкиприбора доотказа при R=100;
r=4;
тыс.ч; составляет тыс. ч.Для определениявероятноститого, что разницасредних величиннаработки доотказа в выборочнойи генеральнойсовокупностине превыситзаданную предельнуюошибку
тыс. ч, т. е. тыс.чрассчитываетсягарантийныйкоэффициент
из следующеговыражения:В таблицезначений вероятностей(см.табл 1.1) значению
соответствуетвероятность0,993.
Следовательно,с вероятностью0,993 можно гарантировать,что средняянаработкаприбора доотказа в генеральнойсовокупностибудет находитьсяв пределах
тыс.ч.Средняяошибка долиприборов снаработкойдо отказа неменее 12 тыс. чпри R=100; r =4;
; составляетДля определениявероятноститого, что разницаудельного весаприборов снаработкойдо отказа неменее 12 тыс. чв выборочнойи генеральнойсовокупностине превыситзаданную предельнуюошибку
(83,0-87,5= -4,5%; 92,0-87,5= +4,5%), т. е.
рассчитываетсягарантийныйкоэффициент
из следующеговыражения:В таблицезначений вероятностей(см.табл 1.1) значению
соответствуетвероятность0,890.
Следовательно,с вероятностью0,890 удельный весприборов снаработкойдо отказа неменее 12 тыс. чбудет находитьсяв пределах
2.3. Типическийотбор
Задача 1. В трех районах30 тыс. семей. Впервом районе-15 тыс.; во втором-12 тыс. и в третьем-3 тыс. семей. Дляопределениячисла детейв семье былапроведена 10%-ятипическаявыборка с отборомединиц пропорциональночисленностиединиц типическихгрупп. Внутригрупп применялсяметод случайногобесповторногоотбора. Результатывыборочногообследованиясемей в трехрайонах представленыв табл.2.8
Таблица 2.8
Номеррайона | Числосемей в районе | Среднеечисло детейв семье | Среднееквадратическоеотклонение |
1 2 3 | 15000 12000 3000 | 1,3 1,8 0,8 | 1,2 2,5 0,5 |
С вероятностью0,997 определитьпредел,в котором находитсясреднеечисло детейв семье в трехрайонах.
Решение.
Средняяошибка выборочнойсредней притипическомбесповторномотборе(см.табл.1.2) определяетсяследующимобразом:
где
– средняя изгрупповыхдисперсийвыборочнойсредней;n – численностьвыборочнойсовокупностипо всем типическимгруппам (районам);
N –численностьгенеральнойсовокупности(число семейво всех
районах).
Объем выборкив каждой типическойгруппе (районе)nj
где Nj- числосемей в j-м районе;
Число семей,выбранных дляобследованияв каждом районепри условии,что численностьвыборочнойсовокупности nпо тремрайонам равна3000 семей
семей; семей; семей.Среднеечисло детейв семье по тремрайонам в выборочнойсовокупности(выборочнаясредняя) с учетомчисленностиотобранныхгрупп
чел.Средняя изгрупповыхдисперсий(внутригрупповаядисперсия)
Средняяошибка выборочнойсредней притипическойвыборке (средняяошибка среднегочисла детейв семье)
чел.Предельнаяошибка среднейс вероятностью0,997 (гарантийныйкоэффициент
)составит чел.С вероятностью0,997 можно утверждать,что в трех районахсреднее числодетей в семьенаходится впределах
Задача 2. Для выявленияпричин простоевбыла проведенафотографиярабочего дня10% рабочих четырехразличныхцехов. Отборрабочих внутрицехов производилсяметодом случайногобесповторногоотбора. В результатеанализа выборочныхданных былавыявлена доляпростоев из-занесвоевременногопоступлениякомплектующихизделий (табл.2.9)
Таблица 2.9
Номерцеха | Число рабочих ввыборке, чел. | Удельныйвес простоевиз-за несвоевременногопоступлениякомплектующихизделий, % |
1 2 3 4 | 20 36 14 30 | 5 10 15 2 |
Итого | 100 | - |
С вероятностью0,954 определитьпределы,в которых находитсядоля простоевна предприятиииз-за несвоевременногопоступлениякомплектующихизделий.
Решение.
Средняяошибка выборочнойдоли при типическомбесповторномотборе (см.табл.1.2)определяетсяследующимобразом:
где
– средняя изгрупповыхдисперсийвыборочнойдоли.Средняявыборочнаядоля простоевиз-за несвоевременногопоступлениякомплектующихизделий в четырехцехах
Дисперсиявыборочнойдоли в i-й типическойгруппе определяетсяпо формуле
Дляпервого цеха -
длявторого -
длятретьего -
длячетвертого -
Средняя изгрупповыхдисперсийвыборочнойдоли
Средняя ошибкавыборочнойдоли
Предельнаяошибка выборочнойдоли с вероятностью0,954 (гарантийныйкоэффициент
)С вероятностью0,954 можно утверждать,что доля простоевиз-за несвоевременногопоступлениякомплектующихизделий находитсяв пределах
Задача 3. В трех населенныхпунктах 10 тыс.семей. В первом -5 тыс.; во втором-1 тыс.; в третьем-4 тыс. семей. Дляопределениясреднего размерасемьи в трехнаселенныхпунктах проектируетсятипическаявыборка сослучайнымбесповторнымотбором внутритипическихгрупп.
Определитьобъем выборки(количествосемей), чтобыс вероятностью0,987 ошибка выборкипри определениисреднегоразмерасемьи не превышала0,5 человека, еслина основе предыдущихобследованийизвестно, чтодисперсия равна9.
Решение.
Численностьтипическойвыборки (привероятности0,987 гарантийныйкоэффициент
) семьи.Задача 4. Для выявленияпричин простоев1000 рабочих предприятиянеобходимопровести типическуювыборку поразличнымцехам.
Определитьколичестворабочих,которое необходимообследовать,чтобы с вероятностью0,997 ошибка выборки(ошибкадоли) непревышала 5%,если на основепредыдущихисследованийизвестно, чтодисперсиятипическойвыборки равна0,16.
Решение.
Необходимаячисленностьвыборки (привероятности0,997 гарантийныйкоэффициент
) чел.Задача 5.На предприятииработает 1000рабочих, из нихв возрасте до30 лет -400 человек, свыше30 лет -600 человек. Дляизучениясреднедневнойвыработки иустановлениядоли мужчинпроведена 10%-ятипическаявыборка с отборомединиц пропорциональночисленностирабочих поуказаннымгруппам (внутригрупп применялсяслучайный методотбора).
На основеобследованияполучены следующиеданные (табл.2.10):
Таблица 2.10
Группы рабочихпо возрасту,лет | Общаячислен-ностьрабочих Nj, чел. | Число обследован-ныхрабочих nj, чел. | Средне-дневнаявыра-ботка ,шт. | Диспер-сиявыработ-ки, | Числомужчин в выборке mj, чел. | Долямужчин в выборке, |
До30 лет Св. 30 | 400 600 | 40 60 | 25 30 | 81 64 | 32 54 | 0,8 0,9 |
Итого | 1000 | 100 | - | - | - | - |
Определить:
- с вероятностью0,954 предельнуюошибку выборкии границы, вкоторых будетнаходитьсясреднедневнаявыработка длявсех рабочихпредприятия;
- с вероятностью0,954 пределы удельноговеса мужчинв общей численностирабочих предприятия.
Решение.
Средняя ошибкавыборочнойсредней притипическомбесповторномотборе)определяетсяпо формуле
Средняя изгрупповыхдисперсий(внутригрупповаядисперсия)
Средняяошибка среднедневнойвыработкирабочих в выборке(средняя
ошибка выборочнойсредней)
Предельнаяошибка среднейс вероятностью0,954 (гарантийныйкоэффициент
)составит шт.Для определениявозможныхпределовсреднедневнойвыработки всехрабочих предприятиярассчитываетсясреднедневнаявыработка ввыборочнойсовокупностипо среднейарифметическойвзвешенной
шт.С вероятностью0,954 можно утверждать,что среднедневнаявыработка всехрабочих предприятиянаходится впределах
Средняяошибка выборочнойдоли при типическомбесповторномотборе определяетсяпо формуле
Средняяиз групповыхдисперсийвыборочнойдоли.
рассчитываетсяследующимобразом:Расчет представленв табл.2.11
Таблица 2.11
Группырабочих повозрасту, лет | Числорабочих nj, чел. | Долямужчин | Доляженщин | Дисперсиядоли | Взвешенныйпоказательдисперсии |
До30 лет Свыше30 | 40 60 | 0,8 0,9 | 0,2 0,1 | 0,16 0,09 | 6,4 5,4 |
Итого | 100 | 11,8 |
Тогда
Средняя ошибкарепрезентативностидля выборочнойдоли
Предельнаяошибка выборочнойдоли с вероятностью0,954 (гарантийныйкоэффициент
)Для определенияпределов долимужчин рассчитываетсясредняя долядля выборочнойсовокупности
С вероятностью0,954 можно утверждать,что доля мужчинна предприятиинаходится впределах
Библиографическийсписок
1. БогородскаяН.А. Статистика.Методы анализастатистической
информации:Текст лекций/ СПбГААП. СПб., 1997. 80 с.
2. ЕфимоваМ.Р., ПетроваЕ.В., РумянцевВ.Н. Общаятеория статистики.
Учебник.М.: ИНФРА-М, 1998. 416 с.
3. Статистика:Курс лекций/ Л.П.Харченко,В.Г.Долженкова,В.Г. Ионини
др.; Под ред.В.Г.Ионина.Новосибирск:Изд-во НГАЭиУ,1996. 310 с.
4. Общая теориястатистики:Статистическаяметодологияв изучении
коммерческойдеятельности.Учебник /А.И.Харламов,О.Э.Башина,
В.Т.Бабурини др.; Под ред.А.А.Спирина,О.Э.Башиной.М.: Финансы
статистика,1994. 296 с.
5. ГусаровВ.М. Теориястатистики.М.: Аудит, 1998. 247 с.
6. ЕлисееваИ.И., ЮзбашевМ.М. Общаятеория статистики.М.: Финансы и
статистика,1998. 367 с.
7. Теориястатистики.Учебник / Подред. Р.А.Шмойловой.М.: Финансы и
статистика,1998. 576 с.
8. Практикумпо теории статистики:Учеб. пособие/ Под ред.
Р.А.Шмойловой.М.: Финансы истатистика,1998. 416 с.
9. ГромыкоГ.Л. Общаятеория статистики:Практикум. М.:ИНФРА-М,
1999. 139 с.
10. Сборникзадач по общейтеории статистики:Учеб. пособиедля
студентоввузов, обучающихсяпо специальности“Статистика”/
В.Е.Овсиенко,Н.В.Голованова,Ю.Г.Королеви др. 2-е изд., перераб.и
доп. М.: Финансыи статистика,1986. 191 с.
Содержание
1.МЕТОДИЧЕСКИЕУКАЗАНИЯ КРЕШЕНИЮ ЗАДАЧПО ТЕМЕ
"ВЫБОРОЧНЫЕ НАБЛЮДЕНИЯ" . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Выборочное исследование . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Виды отборапри выборочном наблюдении . . . . . . . . . . . . . . . . 1
1.3. Ошибки выборочного отбора . . . . . . . . . . . .. . . . . . . . . . . . . . . . . 3
1.3.1. Ошибка выборочной доли . . . . . . . . . . . . . . . . . . .. . . . . . . 3
4.3.2. Ошибка выборочной средней . . . . . . . .. . . . . . . . . . . . . . . 7
1.4.Объем выборки . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . .. . . . . . . . 8
2. ПРИМЕРЫ РЕШЕНИЯЗАДАЧ . . . . . . . . .. . . . . .. . . . . . . . . . . . . . . . . 10
2.1.Механическийи собственно-случайныйотбор . . . . . . . . . . . . . . .. 10
2.2.Серийный отбор . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . .. . . . . . . . 19
2.3.Типическийотбор . . . . . . . . . . . . . . . .. . .. . . . . . . . . . . . . . . . . . . . . . 25
Библиографическийсписок . . . . . .. . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . 31