Смекни!
smekni.com

Статистичні гіпотези та їх перевірка (стр. 2 из 2)

Треба попередити, що критерій погодження Хі-квадрат може застосовуватися для перевірки відповідності вибіркового розподілу будь-якого теоретичного, а не тільки нормального розподілу. Можна навіть сказати, що цей критерій визначає міру розбіжності між даними і моделлю, обраною для їх опису.

По осі абсцис – класи варіаційного ряду; по осі ординат – частоти потрапляння значень змінної у відповідні класи. Темні стовпчики – теоретичний нормальний розподіл частот, світлі – вибірковий.

Для оцінки отриманої величини Хі-квадрат необхідно знати кількість ступенів свободи, що саме і залежить від того, який тип теоретичного розподілу бере участь у розрахунках.

Так, при нормальному розподілі кількість ступенів свободи n=к—3, де к число інтервалів ряду. Обчислене значення Хі-квадрат не повинне перевищувати табличне при заданих значеннях р і а, тоді ми маємо право зробити висновок про неістотну відмінність теоретичного та емпіричного розподілів.

При повному збігу емпіричних частот з обчисленими значення Хі-квадрат дорівнювало б 0.

Побудова рядів розподілу — один з можливих способів опису отриманих даних. А середнє арифметичне і дисперсія — одні з основних характеристик варіюючих об'єктів.

Проте треба мати на увазі, що ці характеристики не є універсальними; для статистичного опису даних як узагальнюючі характеристики сукупності корисними (особливо, якщо сукупність не була розподілена за нормальним законом) можуть виявитися і так звані структурні показники.

На практиці часто використовують такі структурні показники, як медіана, мода, квантилі (квартилі, децилі, перцентилі), мінімальне значення, максимальне значення, розмах варіації й інші.

Так, медіана визначається як середня, щодо якої ряд розподілу поділяється на 2 рівні частини: в обидва боки від медіани розташовується однакова кількість варіант.

Вище, не даючи точного визначення, ми вже говорили про закон розподілу випадкових величин, описуючи в медичних додатках нормальний розподіл, що часто зустрічається.

Проте хотілося б ще раз підкреслити, що це зовсім не єдиний відомий тип розподілу. Крім того, говорячи про побудову вибіркової гістограми розподілу і перевірку нормальності розподілу за допомогою критерію погодження, ми також торкалися теми побудови вибіркової щільності розподілу випадкової величини. Дамо тепер формальне визначення.

Функція F(x), що пов'язує значення xt змінної випадкової величини X з їх імовірністю ph, називається законом розподілу(або функцією розподілу) цієї випадкової величини.

Таким чином, закон розподілу, або його ще називають інтегральною функцією розподілу, описує розподіл імовірності випадкової змінної X. Закон розподілу можна задати у вигляді таблиці, побудувати у вигляді графіка або описати відповідною формулою.

Значення функції F(x) в точці х дорівнює імовірності Р (Х<х) того, що дана випадкова величина X приймає значення менші і рівні даному значенню х.

Такафункція дуже зручна для наочного і короткого подання розподілу імовірності випадкових змінних незалежно від їх характеру. Інтегральна функція розподілу відповідає експериментальній кривій накопичення частот.

Наприклад, нехай деяка випадкова величина X може приймати значення тільки на відрізку числової осі від хх до х2. Тоді вірогідність того, що випадкова величина приймає значення менше х1 або більше х2, дорівнює нулю.

Вірогідність того, що випадкова величина приймає значення менше або рівне х2, дорівнює одиниці. А для всіх значень х, що належать відрізку [х1,х2], функція F(x) є неспадаючою, що змінює свої значення від нуля до одиниці.

З поняттям закону розподілу випадкової величини нерозривно пов'язане поняття щільності розподілу.Так, щільність розподілу безперервної випадкової величини можна уявити як граничну криву р(х), яка апроксимуватиме вибіркову гістограму розподілу даної випадкової величини при нескінченному збільшенні об'єму вибірки (рис. 2).

Формально щільність розподілу р(х) є похідною відповідної функції розподілу F(x).

Визначимо імовірність події, яка полягає в тому, що одне випадково взяте спостереження X потрапить в інтервал [ха,хв], така імовірність чисельно дорівнює площі криволінійної трапеції під кривою р(х) в інтервалі від ха до хв.

Оскільки функція розподілу визначається як імовірність, вона може приймати значення в інтервалі від 0 до 1.

Інша важлива властивість – інтеграл щільності розподілу, взятий по всій області можливих значень (або, не обмежуючи спільності, інтеграл від - до + нескінченності), дорівнює 1.

Нормальний розподіл відіграє дуже важливу роль у статистиці, проте він не є єдиним відомим розподілом. Так, під час перевірки статистичних гіпотез часто використовуються ще 3 типи розподілів, пов'язані з нормальним:

-розподіл Фішера;

-розподіл Хі-квадрат;

-розподіл Стьюдента.

Ці розподіли табульовані, і відповідні таблиці наведені в різних підручниках зі статистики.

Далі ми наводимо короткі відомості про деякі інші закони розподілу дискретних і безперервних випадкових величин, які також можуть зустрітися в реальних додатках.

Криві цієї щільності розподілу були наведені на рис. 3. Для кожного типу розподілу за допомогою критерію Хі-квадрат може бути перевірена гіпотеза про те, що ваша вибірка була розподілена саме за цим законом.