Систематичний відбір (стр. 8 из 14)

Якщо за перший член обрати значення

, то всі члени систематичної вибірки мають значення

. При трьох інших можливих значеннях першого члена всі вони приймають значення відповідно

або

. Таким чином, за окремою вибіркою ми не можемо оцінити величину

. В той час справжнє значення дисперсії вибіркового середнього систематичної вибірки дорівнює

. Цей приклад ілюструє, що при існуванні періодичної варіації в популяції незміщену оцінку дисперсії по вибірці побудувати неможливо.

Але останнє не означає, що зовсім нічого не можна зробити. За виключенням випадку періодичної варіації, ми можемо користуватися інформацією про структуру популяції для того, щоб побудувати математичну модель, яка адекватно представляє існуючий в популяції тип варіації. Після цього ми могли б вивести формулу для оцінки дисперсії, яка для цієї моделі була б наближено незміщеною, хоча, можливо, для інших моделей зміщення було б великим. Вирішувати, яку з моделей необхідно застосовувати, повинен той, хто організовує спостереження.

Далі наведені без доведень деякі прості моделі з відповідними оцінками дисперсій.

Найбільш проста модель відноситься до популяції, в якій

містить деякий тренд плюс «випадковий» доданок. Тоді

де

− деяка функція

. Відносно випадкового доданка

ми припускаємо, що існує надпопуляція, для якої

Оцінка дисперсії

називається незміщеною оцінкою дисперсії

, якщо

тобто, якщо вона незміщена відносно середнього по всім скінченим популяціям, які можуть бути отримані з цієї надпопуляції.

Популяція, одиниці якої розташовані навмання.

Остання формула є оцінкою дисперсії систематичної вибірки

- тої одиниці.

Ця модель застосовується, якщо ми впевненні в тому, що порядок розташування одиниць має в основному випадковий характер відносно ознаки, що спостерігається. Формула дисперсії збігається з формулою дисперсії простого випадкового відбору, і її оцінка незміщена, якщо наша модель справедлива.

Стратифікована популяція, одиниці якої у стратах розташовані навмання

В цьому випадку середнє значення є постійним всередині кожної страти з

одиниць. Оцінка

, яка заснована на середньому квадраті послідовних різниць, не буде незміщеною. В її утворенні приймають небажану участь різниці значень

сусідніх страт і, зокрема, при оцінюванні випадкового доданку дисперсії перша та остання страти мають занадто малу вагу. Якщо наша модель справедлива, то для достатньо великих вибірок ця оцінка буде, взагалі кажучи, перевищувати дисперсію.

Лінійний тренд

Оцінка заснована на квадратах послідовних різниць, що утворюються трьома сусідніми значеннями

у вибірці. Сума квадратів містить

членів. У випадку лінійного тренду його можна виключити, використовуючи кінцеві поправки. Член

дорівнює сумі квадратів ваг у виразі

. Якщо тільки

не мале,

можна замінити звичайним множником

. Це можна зробити, оскільки крайнім стратам надана дуже мала вага, оцінка зміщена, за виключенням випадку, коли

є постійною величиною. Але якщо

велике і наша модель справедлива, то оцінка буде цілком задовільною.

1.9 Стратифікований систематичний відбір

Якщо одиниці певним чином впорядковані, то систематичний відбір забезпечує деякого роду стратифікування з рівними долями відбору. Якщо стратифікування виконано за деяким іншим критерієм, то з кожної страти можна вилучити окрему систематичну вибірку, визначаючи точки відліку незалежно. Такий підхід зручний, якщо ми хочемо отримати окремі оцінки для кожної страти або якщо застосовуються нерівні долі відбору. Цей метод буде, звичайно, більш точним, ніж стратифікований випадковий відбір, якщо систематичний відбір всередині страт більш точний, ніж випадковий відбір всередині страт.

Якщо

− середнє значення для систематичної вибірки у страті

, то оцінка середнього для сукупності

і її дисперсія мають вигляд:

Якщо страт небагато, то задача знаходження дисперсії за вибіркою зводиться до задачі пошуку за вибіркою задовільної оцінки

у кожній страті.

Якщо страт багато, то може бути кращою оцінка, знайдена за методом «поєднанних страт». Оцінка

де підсумовування проводиться за всіма парами страт, у середньому перебільшує дисперсію, навіть якщо варіація періодичного характеру існує всередині страт.

Незміщену оцінку дисперсії похибки можна отримати, якщо з кожної страти вилучаються дві систематичні вибірки з різними точками відліку, які обрані навмання, та з інтервалом відбору

. При цьому кожна страта забезпечує один ступінь вільності. Якщо систематичний відбір є ефективним, то такий прийом призведе до деякої втрати точності. Якщо страт багато, то з більшості їх можна добути по одній систематичній вибірці, а по дві вибірки для оцінювання по ним похибки вилучити лише у частині страт, відібравши цю частину навмання.

1.10 Двовимірний систематичний відбір

При відборі з популяції, що представляє собою деяку територію, найпростішим узагальненням одновимірного систематичного відбору буде відбір за схемою квадратної решітки, яка зображена на рис.1.10.1. Вибірка повністю визначається парою випадкових чисел, які задають координати лівої верхньої одиниці.

Характеристики схеми квадратної решітки були дослідженні на прикладах як теоретичних, так і реальних популяцій. Матерн (1960) дослідив найкращий тип вибірки для випадку, коли кореляція спостережень у довільних двох точках виражається монотонно спадаючою випуклою вгору функцією відстані між ними

. Для корелограм вигляду

відбір по квадратній решітці виявляється достатньо придатним і перевищує простий або стратифікований випадковий відбір з однією одиницею у кожній страті, хоча Матерн і вказує причини, за якими можна очікувати, що найкращою схемою для цієї ситуації виявиться відбір по трикутній решітці, що утворені вершинами рівносторонніх трикутників.