Розрахунок описової статистики і перевірка однорідності вибіркової сукупності
Групування вихідних даних проводиться з метою аналізу структури і закономірностей розподілу досліджуваних показників. У відповідних дослідженнях групування виконують для кожного досліджуваного показника. У курсовій роботі його слід виконати тільки для результативного показника Y, але різними способами.
Якщо варіація ознаки виявляється в порівняно вузьких межах і розподіл носить більш менш рівномірний характер, то будують угрупування з рівними інтервалами.
Нерівні інтервали застосовуються в статистиці, коли значення ознаки варіюють нерівномірно і в значних розмірах, що характерне для більшості соціально – економічних явищ, особливо при аналізі макроекономічних показників.
2.2.1 Групування з використанням рівних інтервалів
Групування з рівними інтервалами доцільні в тих випадках, коли варіація виявляється в порівняно вузьких інтервалах і розподіл одиниць сукупності по даній ознаці є практично рівномірною. Оптимальну кількість груп K з рівними інтервалами визначимо по формулі Стерджесса:
,K=1+3,322*lg36=7
де n – кількість спостережень (обсяг вибірки); n=36;
lg n – десятковий логарифм числа n.
Отримане значення К округляємо до цілого у велику сторону. Потім розраховуємо ширину групувального інтервалу h:
,де
max – максимальне значення показника, що вивчається, у вибірці;Ymax=9948 min – мінімальне значення показника, що вивчається, у вибірці.Ymin=994Значення h також округляємо до цілого у велику сторону.
h=
=1279Після цього можемо встановити межі групувальних інтервалів:
· нижня межа першого групувального інтервалу
a1=Ymin;
a1=994;
· верхня межа першого групувального інтервалу
b1=a1+h;
b=969+1279=2273;
Межі наступних інтервалів встановлюємо так: нижня межа чергового інтервалу приймається рівній верхній межі попереднього інтервалу, а верхня межа дорівнює нижній плюс ширина групувального інтервалу. В результаті весь діапазон зміни значень змінної розбивається на 7 рівних по величині інтервалів.
Одночасно зі встановленням меж групувальних інтервалів задаємо умови віднесення спостережень на інтервал. Їх задаємо у вигляді подвійної нерівності:
ak £ Y < bk, k=1,2,3, ..., K.
Відповідно до цієї умови на інтервал з номером k відносимо ті значення досліджуваної ознаки, які більше або рівні нижньої границі і менше верхньої границі.
Далі розподілимо одиниці вибіркової сукупності (підприємства) по інтервалах у залежності від величини результативної ознаки.
Таблиця 2.4 – Групування підприємств по величині валового доходу, тис. грн.
Номер інтервалу, k | Межі інтерва-лів | Частота fk | Кумулятивна частота, | Частка, wk=fk/n | Кумулятивна частка, |
1 | 994-2273 | 4 | 4 | 4/36=0,111 | 0,111 |
2 | 2273-3552 | 3 | 4+3=7 | 3/36=0,083 | 0,111+0,083=0,194 |
3 | 3552-4831 | 5 | 7+5=12 | 5/36=0,138 | 0,194+0,138=0,332 |
4 | 4831-6110 | 12 | 12+12=24 | 12/36=0,333 | 0,332+0,333=0,665 |
5 | 6110-7389 | 5 | 24+5=29 | 5/36=0,138 | 0,665+0,138=0,803 |
6 | 7389-8668 | 4 | 29+4=33 | 4/36=0,111 | 0,803+0,111=0,914 |
7 | 8668-9948 | 3 | 33+3=36 | 3/36=0,083 | 0,914+0,083=0,997 |
Разом | - | 36 | - | 1 | - |
Після рознесення даних до інтервалів, у табл. 4 підраховуємо частоту попадання спостережень до інтервалу(fk),розраховуємо частки(wk), кумулятивні частоти(Sf) та частки(Sw).
2.2.2 Групування з використанням нерівновеликих інтервалів
Групування з нерівновеликими інтервалами застосовуються для опису статистичних даних розподілу, що мають явну асиметрію, частот і часток. Ширину і межі цих інтервалів встановлюють на основі логічного аналізу попередніх відомостей про якісні і кількісні характеристики досліджуваного явища.
У курсовій роботі в якості одного з можливих рішень задачі групування підприємств за розмірами валового доходу використовуємо досить просту формалізовану процедуру розділення підприємств на групи.
Ця процедура виділення груп об'єктів з нерівними інтервалами досліджуваної ознаки така. Необхідно ранжирувати значення ознаки. Потім весь інтервал її можливих значень [964; 9964] розділити на два інтервали, відокремлюваних друг від друга середнім значенням
ознаки .Ymin = 994 = 5330.08 Ymax=9948
На першому інтервалі [994; 5330.08] будуть розташовані варіанти досліджуваної ознаки менше середнього значення , на другому [5330.08;9964] – більше, ніж середнє значення .
У випадку асиметричного розподілу точка, що відповідає середньому значенню ознаки =5330.08, не ділитиме інтервал [994;9948] на рівні частини, а буде зміщена до якого-небудь з кінців інтервалу.
Вибираємо з двох інтервалів, розділених значенням середньої величини, інтервал найменшої довжини, для чого порівнюємо по модулю величини
=5330.08-994=4336.08 і =9948-5330.081=4617.92.Довжину найменшого з двох порівнюваних інтервалів поділяємо навпіл і отримане значення
додаємо до середнього і вичитаємо з нього.∆Y=4336.08/2=2168.04.
=5330.08-2168.04=3162.04; =5411+2223,5=7498.12.Одержуємо координати двох точок (3162.04) і (7498.12), які відзначаємо на числовій осі варіаційного ряду вліво і вправо від середнього значення:
994 3162.04 5330.08 7498.12 9948
В результаті числова вісь, що відповідає ранжированому варіаційному ряду досліджуваної ознаки, розділяється на три інтервали [994;3162,04], [3162.04;7498,12] і [7498,12;9948], довжини яких можуть бути інтерпретовані як величини, що відмежовують дрібні, середні і великі одиниці сукупності.
Після встановлення меж інтервалів розробимо таблицю частот і часток та побудуємо гістограму розподілу підприємств.