НОРМАЛЬНИЙ РОЗПОДІЛ, який також називають розподілом Гауса, - розподіл вірогідності, який грає найважливішу роль в багатьох галузях знань, особливо у фізиці. Фізична величина підкоряється нормальному розподілу, коли вона схильна до впливу величезного числа випадкових перешкод. Ясно, що така ситуація украй поширена, тому можна сказати, що зі всіх розподілів в природі найчастіше зустрічається саме нормальний розподіл - звідси і походить одна з його назв.
Нормальний розподіл залежить від двох параметрів - зсуву і масштабу, тобто є з математичної точки зору не одним розподілом, а цілим їх сімейством. Значення параметрів відповідають значенням середнього (математичного очікування) і стандартного відхилення.
Стандартним нормальним розподілом називається нормальний розподіл з математичним очікуванням 0 і стандартним відхиленням 1.
Щільність вірогідності нормального розподілу
Функція розподілу
Функція моментів нормального розподілу має вигляд
Нормальні розподіли утворюють масштабно-зсувне сімейство. При цьому параметром масштабу є d = 1/
, а параметром зсуву c = - m/ .За допомогою нормального розподілу визначаються три розподіли, які в даний час часто використовуються при статистичній обробці даних.
РОЗПОДІЛ ПІРСОНУ (хі - квадрат) - розподіл випадкової величини
де випадкові величини X1, X2., Xnнезалежні і мають один і той же розподіл N(0,1).
Розподіл хі-квадрат використовують при оцінюванні дисперсії (за допомогою довірчого інтервалу), при перевірці гіпотез згоди, однорідності, незалежності, перш за все для якісних (категорізованих) змінних, що приймають кінцеве число значень, і в багатьох інших завданнях статистичного аналізу даних.
РОЗПОДІЛ СТЬЮДЕНТА - це розподіл випадкової величини
де випадкові величини U і X незалежні, U має розподіл стандартний нормальний розподіл N(0,1), а X - розподіл хі - квадрат з n мірами свободи. При цьому n називається «Числом мір свободи» розподілу Стьюдента.
Розподіл Стьюдента був введений в 1908 р. англійським статистиком Ст. Госсетом, що працював на фабриці, що випускає пиво. Ймовірносно-статистичні методи використовувалися для ухвалення економічних і технічних рішень на цій фабриці, тому її керівництво забороняло В. Госсету публікувати наукові статті під своїм ім'ям. У такий спосіб охоронялася комерційна таємниця, «ноу-хау» у вигляді ймовірносно-статистичних методів, розроблених Ст. Госсетом. Проте він мав можливість публікуватися під псевдонімом «Стьюдент». Історія Госсета - Стьюдента показує, що ще сто років тому менеджерам Великобританії була очевидна велика економічна ефективність ймовірносно-статистичних методів.
В даний час розподіл Стьюдента - один з найбільш відомих розподілів серед використовуваних при аналізі реальних даних. Його застосовують при оцінюванні математичного очікування, прогнозного значення і інших характеристик за допомогою довірчих інтервалів, по перевірці гіпотез про значення математичних очікувань, коефіцієнтів регресійної залежності, гіпотез однорідності вибірок і так далі
Розподіл Фішера - це розподіл випадкової величини
де випадкові величини Х1 і Х2 незалежні і мають розподіли хі - квадрат з числом мір свободи k1і k2відповідно. При цьому пара (k1, k2) - пара «чисел мір свободи» розподілу Фішера, а саме, k1- число мір свободи чисельника, а k2- число мір свободи знаменника. Розподіл випадкової величини F названий на честь великого англійського статистика Р.Фішера (1890-1962), що активно використав його в своїх роботах.
Розподіл Фішера використовують при перевірці гіпотез про адекватність моделі в регресійному аналізі, про рівність дисперсій і в інших завданнях прикладної статистики.
Виразу для функцій розподілу хі - квадрат, Стьюдента і Фішера, їх щільності і характеристик, а також таблиці, необхідні для їх практичного використання, можна знайти в спеціальній літературі.
Якщо потрібно отримати теоретичні частоти f' при вирівнюванні варіаційного ряду по кривій нормального розподілу, то можна скористатися формулою
де
- сума всіх емпіричних частот варіаційного ряду; h - величина інтервалу в групах; - середнє квадратичне відхилення; - нормоване відхилення варіантів від середньої арифметичної; решта всіх величин легко обчислюється по спеціальних таблицях.За допомогою цієї формули ми отримуємо теоретичний (імовірнісне) розподіл, замінюючи ним емпіричний (фактичне) розподіл, по характеру вони не повинні відрізнятися один від одного.
Порівнюючи отримані величини теоретичних частот f' з емпіричними (фактичними) частотами f, переконуємося, що їх розбіжності можуть бути вельми невеликі.
Об'єктивна характеристика відповідності теоретичних і емпіричних частот може бути отримана за допомогою спеціальних статистичних показників, які називають критеріями згоди.
Для оцінки близькості емпіричних і теоретичних частот застосовуються критерій згоди Пірсону, критерій згоди Романовського, критерій згоди Колмогорова[1].
Найбільш поширеним є критерій згоди К. Пірсона, який можна представити як суму відносин квадратів розбіжностей між f' і f до теоретичних частот:
Обчислене значення критерію необхідно порівняти з табличним (критичним) значенням . Табличне значення визначається по спеціальній таблиці, воно залежить від прийнятої вірогідності Р і числа мір свободи до (при цьому до = m - 3, де m - число груп у ряді розподілу для нормального розподілу). При розрахунку критерію згоди Пірсону повинна дотримуватися наступна умова: достатньо великим повинне бути число спостережень (n
50), при цьому якщо в деяких інтервалах теоретичні частоти < 5, то інтервали об'єднують для умови > 5.Якщо
, то розбіжності між емпіричними і теоретичними частотами розподілу можуть бути випадковими і припущення про близькість емпіричного розподілу до нормального не може бути знехтуване.В тому випадку, якщо відсутні таблиці для оцінки випадковості розбіжності теоретичних і емпіричних частот, можна використовувати критерій згоди В.І. Романовського КРом , який, використовуючи величину
, запропонував оцінювати близькість емпіричного розподілу кривої нормального розподілу за допомогою відношенняде m - число груп; до = (m - 3 ) - число мір свободи при численні частот нормального розподілу.
Якщо вищезгадане відношення < 3, то розбіжності емпіричних і теоретичних частот можна вважати випадковими, а емпіричний розподіл - відповідним нормальному. Якщо відношення > 3, то розбіжності можуть бути достатньо істотними і гіпотезу про нормальний розподіл слід відкинути.
Критерій згоди А.Н. Колмогорова використовується при визначенні максимальної розбіжності між частотами емпіричного і теоретичного розподілу, обчислюється за формулою
де D - максимальне значення різниці між накопиченими емпіричними і теоретичними частотами;
- сума емпіричних частот.По таблицях значень вірогідності
- критерію можна знайти величину , відповідну вірогідності Р. Еслі величина вірогідності Р значительна по відношенню до знайденої величини, то можна припустити, що розбіжності між теоретичним і емпіричним розподілами неістотні.Необхідною умовою при використанні критерію згоди Колмогорова є достатньо велике число спостережень (не менше ста).
За первинними даними щодо розміру кредитування юридичних осіб установами комерційних банків України станом на 01/01/2009 р, наведеними в додатку 1, побудуємо статистичний ряд розподілу та розрахуємо основні показники ряду розподілу.
Визначимо кількість груп, скориставшись формулою Стерджесса:
Визначимо розмір інтервалу, скориставшись формулою: