РОЗДІЛ І. СИСТЕМАТИЧНИЙ ВІДБІР
1.1 Оцінювання середнього та сумарного значення популяції
Введемо поняття кластеру. Кластер – це група одиниць популяції, яка розглядається як вихідна одиниця вибірки. Нехай
. Популяцію можна розбити на кластерів, у кожному з яких знаходиться n одиниць. Тоді процедура випадкового відбору систематичної вибірки го порядку така ж сама, як і процедура вибору одного із кластерів (див. табл. 1.1.1).Таблиця 1.1.1 Можливі систематичні вибірки
го порядкуСтрати | Кластер | Середнє страти | |||||
1 | 2 | … | i | … | k | ||
1 | … | … | |||||
2 | … | … | |||||
… | … | … | … | … | … | … | … |
… | … | ||||||
Середнє систематичної вибірки | … | … |
Нехай випадкова величина
– середнє значення систематичної вибірки, тобто з імовірністю дорівнює значенню , .Розподіл
має вигляд ~ .Теорема 1.1.1. Середнє значення
систематичної вибірки є незміщеною оцінкою для середнього значення популяції .Доведення.
де
-ий член -тої систематичної вибірки, , ,зокрема, дисперсія
дорівнює .Теорема доведена.
Теорема 1.1.2. Дисперсія середнього значення систематичної вибірки визначається формулою
(1.1.1)Де
є дисперсією одиниць, які належать одній систематичній вибірці (wsy − від англ. within − всередині та systematic − систематичний).
Доведення.
Дисперсія популяції з
одиниць визначається формулою .Розглянемо тотожність
Піднесемо обидві частини рівності до квадрату
.Підсумуємо праву та ліву частини рівності за
та :Покажемо, що
:Отже, маємо
, .Дисперсія
дорівнює(обчислена за таблицею розподілу
). ТодіЗвідси
,або, що теж саме,
.Теорема доведена.
Наслідок. Середнє значення для систематичної вибірки більш точне, ніж середнє для простої випадкової вибірки, тобто
тоді і тільки тоді, коли
. (1.1.2)Доведення.
Дисперсія середнього значення простої випадкової вибірки дорівнює
.Тоді з (1.1.1) випливає, що
тоді і тільки тоді, коли .Звідси маємо
.Домножимо обидві частини нерівності на
та праворуч винесемо : .Враховуючи, що
маємо ,або,
.Отже ,
.Наслідок доведено.
Таким чином, систематичний відбір точніший, ніж простий випадковий відбір, якщо дисперсія
одиниць систематичних вибірок більша дисперсії всієї популяції. Систематичний відбір точний, коли одиниці всередині однієї й тієї ж вибірки неоднорідні, та неточний, коли вони однорідні. До цього можна прийти інтуїтивно. Якщо всередині систематичної вибірки варіація у порівнянні з варіацією популяції невелика, то послідовно вибрані одиниці вибірки несуть більш або менш однакову інформацію. Інший вираз для дисперсії наведемо у теоремі 1.1.3.Теорема 1.1.3.
, (1.1.3)