Так, в першому прикладі 60 % осіб засуджені на строк, який збігається з середнім строком позбавлення волі; в другому – їх лише 20 %, але розмах варіації в другому прикладі менший, ніж в першому, що не відповідає ні логіці, ні дійсності.
За даними табл. 9 розмах варіації дорівнює 4 особам (5 – 1); за даними, які застосовані для розрахунку медіани, – 20 рокам (35 – 15). Це ще раз підтверджує висновок про те, що розмах варіації істотно залежить від значень ознаки і дає лише приблизну характеристику наявності коливань ознаки в сукупності.
Для характеристики реального розподілу відхилень окремих значень одиниць сукупності від середньої величини застосовуються середнє лінійне та середнє квадратичне відхилення.
Середнє лінійне відхилення – це арифметична середня з абсолютних значень відхилень ознаки окремих варіантів від їх середньої арифметичної. Середнє лінійне відхилення обчислюється за формулою:
,При обчисленні цього показника відхилення від середньої величини однаково оцінюються як в більший, так і менший бік. Це є не зовсім вірним з точки зору економічного аналізу, тому що нас завжди цікавлять зрушення і зміни в сукупності в якійсь-то один бік і ми дуже обережно ставимося до змін в іншій бік. Наприклад, незначні строки покарання свідчать про те, що особами вчинено менше тяжких злочинів.У табл. 4наведений розрахунок середнього лінійного та середнього квадратичного відхилень.
Таблиця 4.Розрахунок середнього лінійного та середнього квадратичного відхилень
Приклад № 1 | Приклад № 2 | ||||||||
x | f | x – | (x- )f | (х- )2f | x | f | x – | (х- )f | (х- )2f |
1 | 5 | - 5 | - 25 | 125 | 3 | 30 | - 3 | - 90 | 270 |
4 | 15 | - 2 | - 30 | 60 | 5 | 10 | - 1 | - 10 | 10 |
6 | 60 | 0 | 0 | 0 | 6 | 20 | 0 | 0 | 0 |
8 | 15 | 2 | 30 | 60 | 7 | 10 | 1 | 10 | 10 |
11 | 5 | 5 | 25 | 125 | 9 | 30 | 3 | 90 | 270 |
Всього | 100 | _ | 0 | 370 | _ | 100 | _ | 0 | 560 |
На підставі даних, які наведені в табл. 4, видно, що для обчислення середнього лінійного відхилення слід брати абсолютне значення показників. Якщо підсумувати усі значення з урахування знаку, то в четвертому та дев`ятому стовпчиках табл. 4одержимо нуль. З точки зору математики одержання нуля є обов`язковим, які б первинні дані ми не мали. Для статистики нульовий результат немає сенсу.
Обчислимо за даними табл. 4середнє лінійне відхилення для першого прикладу – 1,1 роки (підсумуємо усі дані, наведені в четвертому стовпчику, незважаючи на знак перед числом, тобто 25 + 30 + 0 + 30 + 25, цю суму слід поділити на загальну кількість засуджених осіб, на 100 чоловік); для другого прикладу – 2,0 роки ((90 + 10 + 0 +10 +90) : 100), за даними, які наведені у дев`ятому стовпчику. Одержані дані характеризують, що друга сукупність має більші коливання, ніж перша.
Найчастіше при економічних розрахунках для оцінки щільності взаємозв`язку явищ, обчислення похибки репрезентативності тощо використовується середнє квадратичне відхилення.
Середнє квадратичне відхилення – це корінь квадратний із середнього квадрату відхилень ознаки кожного варіанту від їх середньої арифметичної. Цей показник обчислюється за такою формулою:
,Щоб його знайти, достатньо суму п`ятого і десятого стовпчиків табл. 4поділити на загальну кількість показників і з одержаної величини добути корінь квадратний.
Середнє квадратичне відхилення в першому прикладі дорівнює 1,92 рокам (370 ділимо на 100 і добуваємо корінь квадратний), в другому прикладі – 2,37 рокам. Отже, середнє квадратичне відхилення дає змогу встановити, що друга сукупність (другий приклад) має значно більші коливання ознак – в 1,23 рази ( 2.37 : 1.92).
Усі наведені показники (розмах варіації, середнє лінійне і середнє квадратичне відхилення) дають змогу встановити і оцінити міру коливання ознак в абсолютному розмірі, тому всі вони обов`язково мають точно такі ж одиниці виміру, як і одиниці сукупності. Для роз`яснення техніки обчислення показників варіації і були взяті дві однакові з точки зору одиниць виміру сукупності, тому їх можна і порівнювати між собою.
Недоліком середнього квадратичного відхилення є те, що воно характеризує тільки абсолютну міру коливання ознаки. Якщо обчислювати середнє квадратичне відхилення за даними табл. 9, то можна одержати показник 1,28 чол. В цьому разі порівнювати його з показниками наших прикладів не можна.
Між середнім лінійним, середньо величиною і середнім квадратичним відхиленням існує такий зв`язок 1,25 Λ = σ, а σ = 1/3
. В симетричних рядах розподілу середнє квадратичне відхилення можна визначити за формулою: σ = 1/6 (xmax– xmin), або ж σ = 1/6 R.Розрахунок середнього квадратичного відхилення має логічний зміст лише в тому випадку, коли фактичний розподіл ознаки близький до нормального. Для явно асиметричних розподілень його розрахунок не має сенсу.
Квадрат середнього відхилення має назву дисперсії. Значення цього показника істотно зростає, коли нам необхідно обчислити варіацію альтернативної ознаки. Як вже підкреслювалось, альтернативна ознака – це така, яку кожна одиниця сукупності або має, або не має. Наприклад, наявність вченого ступеню у викладачів вищого учбового закладу.
Кількісно варіація альтернативної ознаки виражається двома значеннями: наявність ознаки позначається через одиницю, а її відсутність – нуль. Позначивши частку одиниць, які мають дану ознаку через р, а одиниці, які не мають цієї ознаки через q= (1 – р), визначимо середню арифметичну альтернативної ознаки. Вона буде дорівнювати:
.Після цього обчислимо дисперсію альтернативної ознаки:
= q2p+ p2q= pq(q+ p) == p*q= p(1 – p).
Отже частка для альтернативної ознаки замінює середню величину, а дисперсія є добутком частки на доповнення її до одиниці.
Для більш детальної характеристики сукупності застосовується відносний показник – коефіцієнт варіації. Існують різні думки щодо того, за яким з показників його можна обчислювати. На практиці завжди порівнюють за допомогою середнього квадратичного відхилення, яке найбільш реалістично відображає коливання ознаки в сукупності.
Коефіцієнт варіації – це відсоткове відношення середнього квадратичного відхилення до середнього рівня. Як правило, цей середній рівень обчислюється за формулою середньої арифметичної. Коефіцієнт варіації обчислюється за формулою:
,За даними табл. 4коефіцієнт варіації в першому прикладі дорівнює 32,0 % ( 1,92 : 6 х 100), в другому прикладі – 39,5 % (2,37 : 6 х 100); за даними табл. 9 – 53,3 % (1,28 : 2,4 х 100).
Коефіцієнт варіації дає змогу порівняти різні сукупності. Чим менше цей показник, тим менше коливання ознаки в сукупності і тим більш однорідна сукупність, і навпаки.
Показник коефіцієнта варіації слід використовувати для оцінки однорідності сукупності. Існує оціночний критерій – сукупність однорідна і середня величина в ній є типовою, якщо коефіцієнт варіації не перевищує 33 %. Таким чином, тільки сукупність, яка наведена в першому прикладі, є однорідною, хоча в ній розмах варіації був значно більшим, ніж в інших сукупностях.
Розрізняють такі значення відносних коливань (варіації)
– незначну ознаку V ≤ 10 %
– середню V = 10,1 – 30 %.
– велику V > 30 %.
При розрахунку коефіцієнта варіації ознаки у різних сукупностях та умовах виникає необхідність його оцінки. Наприклад, якщо вивчають кількість справ, розглянутих суддями різних місцевих судів за визначений період (місяць, рік), кількість осіб засуджених повторно у різних виправних установах тощо, то істотність різниці коефіцієнтів варіації розраховують за формулою:
tф =
Різницю коефіцієнтів варіації вважають невипадковою, якщо критерій згоди tф › 3, якщо ж tф ‹ 3, роблять висновок, що при цій кількості спостережень нульова гіпотеза не підтверджується, і тому істотна різниця не доведена.
Список літератури
1. Лунеев В.В. Юридическая статистика: Учебник. – М.: Юристъ, 2009. – 400 с.