У 14 сільськогосподарських дослідженнях на однорідність Хейнс (1948) знайшов, що відбір за квадратною решіткою дає майже ту саму точність, що і двовимірний простий випадковий відбір. Мілн (1959) вивчав відбір за «центральною» схемою квадратної решітки, коли вибірка визначається точкою, яка лежить в центрі квадрату, у 50 випробуваннях на однорідність. Такий спосіб відбору виявився краще простого випадкового відбору і, можливо, дещо краще, ніж стратифікований випадковий відбір, хоча остання перевага не була статистично значущою. Ці результати вказують на те, що принаймні, для даних такого типу, автокореляція виражена слабко. При оцінюванні по мапі площі, яку займає ліс чи вода, Матерн у двох прикладах помітив, що квадратна решітка перевищує випадкові методи відбору.
Два типи двовимірної систематичної вибірки
Рис. 1.10.1 Рис. 1.10.2 Вирівняна вибірка або Невирівняна вибірка за схемою «квадратної решітки»
На рис. 1.10.2 наведена систематична вибірка іншого типу, яка називається невирівняною вибіркою.
1. Добуваючи пару випадкових чисел, задаємо координати лівої верхньої одиниці:
2. Добуваючи пару випадкових чисел, задаємо горизонтальні координати двох одиниць в першому стовбці:
Наприклад, в другому рядку − координати правої одиниці, в третьому рядку − координати центральної одиниці.
3. Добуваючи пару випадкових чисел, задаємо вертикальні координати двох одиниць в першому рядку:
Наприклад, в другому стовбці − координати нижньої одиниці, в третьому стовбці − координати центральної одиниці.
Після цього постійний інтервал
(що дорівнює сторонам квадратів) однозначно задає розташування всіх інших точок. Дослідження Кенуя (1949) і Даса (1950) для простих двовимірних корелограм вказують на те, що невирівняна схема часто дає кращі результати, ніж квадратна решітка та стратифікований випадковий відбір.Ще одне свідчення переваги невирівняної вибірки дає досвід планування експериментів, який виявив, що для розміщення спостережень у прямокутній області цілком можна застосовувати схему латинського квадрату. Вважатимемо, що латинський квадрат (5
5), який показаний на рис. 1.10.3, задає розбиття області на п’ять систематичних вибірок, кожна з яких відповідає певній літері. Є деякі данні про те, що цей особливий квадрат, що називається латинським квадратом «ходом коня», буде більш точним, ніж навмання вибраний квадрат (5 5). Причина цього, ймовірно, у тому, що у першого ніяка вибірка не містить двох елементів не тільки з одного рядка чи одного стовпця, але й із кожної діагоналі.Принципом побудови латинських квадратів скористалися Хомейер та Блек при відборі на прямокутних полях вівса. Кожне поле містило 21 ділянку. Три можливі систематичні вибірки, які позначені відповідно літерами A, B, C, що показані на рис. 1.10.4. Таке розміщення, коли на кожному полі обирається навмання одна з літер, збільшило точність приблизно на 25% у порівнянні зі стратифікованим випадковим відбором, в якому рядки виступали стратами. Оскільки кожна літера зустрічається тричі в одному стовпчику і по два рази в інших, таке розміщення не зовсім точно задовольняє означенню латинського квадрату, але, наскільки це можливо, відповідає йому.
Дві схеми систематичного відбору, засновані на латинських квадратах
Рис. 1.10.3 Латинський квадрат «ходом коня» Рис. 1.10.4 Схема систематичного відбору для прямокутного поля 3
7Йейтс (1960), який назвав розміщення такого типу відбором за решіткою, розглядає їх застосування для двовимірного та тривимірного відбору. У випадку трьох вимірів кожний рядок, кожний стовпець та кожна вертикаль можуть бути представлені у вибірці шляхом відбору
одиниць з одиниць популяції. Якщо вибірка містить одиниць, то в ній можуть бути представленні кожне з сполук рядків та стовпців або рядків та вертикалей, або стовпців та вертикалей. Паттерсон (1954) дослідив розміщення, які дають незміщену оцінку похибки.1.11 Приклади розв’язування задач
Приклад 1. У таблиці 1.11.1 наведена кількість саджанців на кожному футі довжини гряди, загальною довжиною у 200 футів.
Знайти дисперсію середнього систематичної вибірки, що включає кожний двадцятий фут гряди. Порівняти її з дисперсією простої випадкової вибірки. Для всіх вибірок
.Таблиця 1.11.1 Число саджанців
Фути довжини гряди | Підсумки систематичних вибірок | ||||||||||
1-20 | 21-40 | 41-60 | 61-80 | 81-100 | 101-120 | 121-140 | 141-160 | 161-180 | 181-200 | ||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | ||
8 6 6 23 25 16 28 21 22 18 26 28 11 16 7 22 44 26 31 26 | 20 19 25 11 31 26 29 19 17 28 16 9 22 26 17 39 21 14 40 30 | 26 26 10 41 30 55 34 56 39 41 27 20 25 39 24 25 18 44 55 39 | 34 21 27 25 32 43 33 45 23 27 37 14 14 24 18 17 14 38 36 29 | 31 23 41 18 15 21 8 22 11 3 4 5 11 9 25 16 13 22 18 9 | 24 19 28 18 29 24 33 37 32 26 36 20 43 27 20 21 18 19 24 30 | 18 13 7 9 11 20 16 9 14 15 20 21 15 14 13 9 25 17 7 30 | 16 12 8 10 12 20 17 12 7 17 21 26 16 18 11 19 27 29 31 29 | 36 8 29 33 14 13 18 20 13 24 29 18 16 20 6 15 4 8 8 10 | 10 35 7 9 12 7 6 14 12 15 18 4 4 9 8 8 9 10 5 3 | 223 182 188 197 211 245 222 255 190 214 234 165 177 202 149 191 193 227 225 235 | |
Підсумки для страт | 410 | 459 | 674 | 554 | 325 | 528 | 303 | 358 | 342 | 205 | 4155 |
Розв’язання.
а) Систематична вибірка:
Дисперсія середнього систематичної вибірки дорівнює
.б) Проста випадкова вибірка:
Дисперсія простої випадкової вибірки дорівнює
.Відповідь:
. Дисперсія середнього систематичної вибірки краща ніж дисперсія простої випадкової вибірки.Приклад 2. Популяція, що складається з 360 домогосподарств (які перенумеровані від 1 до 360), розміщена в картотеці у алфавітному порядку за прізвищами головних членів господарств. Домогосподарства, де голова сім’ї небілий, мають наступні номери: 28, 31-33, 36-41, 44, 45, 47, 55, 56, 58, 68, 69, 82, 83, 85, 86, 89-94, 98, 99, 101, 107-110, 114, 154, 156, 178, 223, 224, 296, 298-300, 302-304, 306-323, 325-331, 333, 335-339, 341, 342. (Серед небілих іноді зустрічаються «скупчення» домогосподарств через зв'язок між прізвищем та кольором шкіри).
Порівняйте точність систематичної вибірки кожного восьмого домогосподарства з простою випадковою вибіркою того ж обсягу при оцінюванні частки домогосподарств, у яких головний член сім’ї небілий.
Розв’язання.
Будемо позначати домогосподарство, де голова сім’ї небілий як 1 і відповідно де голова білий – 0. Тоді запишемо всі систематичні вибірки кожного восьмого домогосподарства у таблицю 1.11.2:
Таблиця 1.11.2 Дані по 8-ми систематичним вибіркам
Номер систематичної вибірки ( =8) | ||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | |
1 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | |
1 | 0 | 0 | 1 | 1 | 0 | 1 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | |
0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 1 | 1 | 0 | 1 | 1 | 0 | 0 | |
1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | |
0 | 1 | 1 | 0 | 1 | 0 | 0 | 0 | |
0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | |
0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | |
1 | 1 | 1 | 0 | 1 | 1 | 1 | 0 | |
1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | |
1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | |
1 | 1 | 0 | 1 | 1 | 1 | 1 | 1 | |
1 | 1 | 0 | 1 | 0 | 1 | 1 | 1 | |
1 | 1 | 0 | 1 | 1 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
0,2222 | 0,2667 | 0,1556 | 0,2667 | 0,2667 | 0,2222 | 0,2444 | 0,1556 | |
10 | 12 | 7 | 12 | 12 | 10 | 11 | 7 |
а) Систематична вибірка