Смекни!
smekni.com

Систематичний відбір (стр. 7 из 14)

В 1949 році Кенуй показав, що нерівності, які містяться у твердженні теореми 1.6.1, залишаються справедливими, якщо зробити менш жорсткими дві умови (1.6.1), а саме

.

В цьому випадку кожна з трьох середніх дисперсій для надпопуляції збільшується в однаковому ступені.

1.7 Реальні популяції

Дослідження були проведені для різних реальних популяцій. Деякі з цих досліджень наведені в таблиці 1.7.1. Перші три дослідження проводилися за допомогою географічних мап. У першому з них популяція складається з 288 значень висот точок, які знаходяться на відстані 0,1 милі одна від одної у гірській місцевості.

У двох наступних популяціях даними є долі довжин відрізків прямих, які проведені на мапі з розфарбуванням, що приходяться на області з визначеним покриттям (під травою, лісом і т.п.). Ці приклади можна вважати найбільш близькими до моделей з неперервною у строгому сенсі варіацією.

Наступні три дослідження засновані на показах температури на протязі 192 послідовних днів у наступних точках: (а) 12 дюймів під поверхнею трави, (б) 4 дюйма під поверхнею землі, (в) у повітрі. Ці три дослідження відображають три різних ступені впливу (у напрямку збільшення) на характеристику, що вивчаються, а саме - нестійкі щоденні зміни погоди та повільні сезонні зміни.

У останніх дослідженнях спостерігались рослини або дерева, що ростуть у послідовних точках, які розташовані вздовж деякої лінії. При обстеженні картоплі, типовою для цієї групи, скінчена популяція складається зі значень врожаю на 96 грядках деякого поля.

У деяких обстеженнях

порівнювали з
для стратифікованої випадкової вибірки з об’ємом страт
і двома одиницями у кожній страті. Таке порівняння є цікавим, оскільки за даними вибірки можна дістати незміщену оцінку
. Для
(з об’ємом страти
і однією одиницею у кожній страті) або для
її отримати неможна. У більшості джерел безпосереднє порівняння з
у явному вигляді не проводиться, але взагалі
дає виграш у точності у порівнянні з
.

У роботах Йетса та Фінні порівняння проводиться відносно цілої низки значень

та
для кожної скінченої популяції.

Таблиця 1.7.1 Реальні популяції, що вивчені при аналізі систематичного відбору

Автор Обсяг популяції
Вид даних
Yates (1948) 288 Значення висот у точках, що знаходяться на відстані 0,1 милі одна від одної, отримані за мапою англійського державного картографічного управління
Osborne (1942) * Відсоток площі під (а) оброблюваною землею, (б) чагарником, (в) травою, (г) лісом на паралельних прямих, які проведені на мапі з розфарбуванням
Osborne (1942) * Відсоток площі під ялиною Дугласа, який підрахований за допомогою паралельних прямих, що проведені на мапі з розфарбуванням
Yates (1948) 192 Температура ґрунту (12 дюймів під поверхнею трави) на протязі 192 послідовних днів
Yates (1948) 192 Температура ґрунту (4 дюймів під поверхнею землі) на протязі 192 послідовних днів
Yates (1948) 192 Температура повітря на протязі 192 послідовних днів
Yates (1948) 96 Врожай картоплі на 96 грядках
Finney (1948) 160 Об’єм лісу, придатного до продажу, у розрахунку на ділянку шириною у 3 ряди та змінної довжини (Mt. Stuart forest)
Finney (1948) 288 Об’єм підростаючого лісу на ділянку шириною у 2,5 ряди та довжиною у 80 рядів (Black’s Mountain forest)
Finney (1950) 292 Об’єм лісу на ділянку шириною в 2 ряди та змінної довжини (Dehra Dun forest)
Johnson (1943) 400** Число саджанців на 1 фут довжини гряди для 4 гряд саджанців листяних порід
Johnson (1943) 400** Число саджанців на 1 фут довжини гряди для 3 гряд саджанців хвойних порід
Johnson (1943) 400** Число пересаджених дерев хвойних порід на 1 фут довжини гряди для 6 гряд

* Теоретично

нескінчене, якщо вважати, що товщина прямих нескінченно мала

** Наближено. Насправді це число змінювалось від гряди до гряди.

Для цих випадків дані таблиці 1.7.2 є геометричним середнім відношень дисперсій для окремих значень

. Інші автори проводили порівняння тільки для одного значення
у кожній популяції, але іноді приводили данні для різних ознак або декількох реальних популяцій одного і того ж характеру. При цьому знову бралось геометричне середнє з відношень дисперсій.

Таблиця 1.7.2 Відносна точність систематичного та стратифікованого випадкового відбору

Данні Розмах значень
Відносна точність систематичного відбору в порівнянні зі стратифікованим відбором
Висоти 2 − 20 2,99 5,68
Відсоток площі (4 типів покриття) 4,42
Відсоток площі під ялиною Дугласа 1,83
Температура ґрунту (12 дюймів) 2 − 24 2,42 4,23
Температура ґрунту (4 дюйма) 4 − 24 1,45 2,07
Температура повітря 4 − 24 1,26 1,65
Картопля 3 − 16 1,37 1,90
Об’єм лісу (Mt. Stuart) 2 − 32 1,07 1,35
Об’єм лісу (Black’s Mt) 2 − 24 1,19 1,44
Об’єм лісу (Dehra Dun) 2 − 32 1,39 1,89
Листяні саджанці 14 1,89
Хвойні саджанці 14 − 24 2,22
Пересадженні хвойні дерева 12 − 22 0,93

Хоча ці данні обмежені за масштабами, результати справляють враження. В тих дослідженнях, де можливе порівняння з

, систематична вибірка незмінно дає, хоча і помірний, але цілком відчутний виграш у точності. Медіанне значення відношень
дорівнює 1,4. Виграш у точності у порівнянні з
суттєвіший, тут медіанне значення відношень дорівнює 1,9. Характер знайдених результатів взагалі відповідає очікуваному, хоча зважаючи на невелику кількість обстежень важко було розраховувати на отримання певних висновків. Виграш виявився найбільшим для тих видів даних, відносно яких можна було припустити, що їхня варіація найбільш близька до неперервної. З цієї точки зору і при переході від ґрунтових температур до температур повітря можна було очікувати, що відношення
зменшиться. З останніх трьох ознак (дані про лісові розсадники) виграшу у точності не виявилось лише для одного − пересаджених хвойних дерев
, які старіші й більш однорідні, ніж молоді саджанці.

1.8 Оцінювання дисперсії за окремою вибіркою

Згідно з результатами, які відносяться до простих випадкових вибірок з

, ми можемо обчислити незміщену оцінку дисперсії вибіркового середнього, при цьому оцінка буде незміщеною незалежно від виду популяції. Але для систематичної вибірки ця корисна властивість не зберігається, оскільки її можна розглядати лише як просту випадкову вибірку з
, тобто одним членом. Проілюструємо це на прикладі зі зміною «по синусоїді». Нехай

,

де

(обираємо кожну четверту одиницю) та
Послідовними спостереженнями в популяції будуть