Дисперсійний аналіз та побудова статистичних графіків
Дисперсійний аналіз
Характеристики варіації
В одних сукупностях індивідуальні значення ознаки щільно групуються навколо центра розподілу, в інших — значно відхиляються. Чим менші відхилення, тим однорідніша сукупність, а отже, тим більш надійні й типові характеристики центра розподілу, передусім середня величина. Вимірювання ступеня коливання ознаки, її варіації — невід'ємна складова аналізу закономірностей розподілу. Міри варіації широко використовуються у практичній діяльності: для оцінювання диференціації домашніх господарств за рівнем доходу, фінансового ризику інвестування, ритмічності роботи підприємств, сталості врожайності сільськогосподарських культур тощо.
На основі характеристик варіації оцінюється інтенсивність структурних зрушень, щільність взаємозв'язків соціально-економічних явищ, точність результатів вибіркового обстеження.
Для вимірювання та оцінювання варіації використовуються абсолютні та відносні характеристики. До абсолютних належать: варіаційний розмах, середнє лінійне та середнє квадратичне відхилення, дисперсії; відносні характеристики подаються низкою коефіцієнтів варіації, локалізації, концентрації.
Узагальнюючою характеристикою варіації є середнє відхилення:
а) лінійне
,б) квадратичне, або стандартне
;в) дисперсія (середній квадрат відхилень)
.Види та взаємозв'язок дисперсій
Дисперсія посідає особливе місце у статистичному аналізі соціально-економічних явищ. На відміну від інших характеристик варіації завдяки своїм математичним властивостям вона є невіддільним і важливим елементом інших статистичних методів, зокрема дисперсійного аналізу.
Для ознак метричної шкали дисперсія — це середній квадра відхилень індивідуальних значень ознаки від середньої:
.Як і будь-яка середня, дисперсія має певні математичні властивості. Сформулюємо найважливіші з них.
1. Якщо всі значення варіант xj зменшити на сталу величину А, то дисперсія не зміниться:
.2. Якщо всі значення варіант xj змінити в А раз, то дисперсія зміниться в А2 раз:
.3. Якщо частоти замінити частками, дисперсія не зміниться. Нескладними алгебраїчними перетвореннями можна довести,
що дисперсія — це різниця квадратів
. Якщо ,то, замінивши
і поділивши всі складові на п, дістанемо: ,де
– квадрат середньої величини; – середній квадрат значень ознаки.Дисперсія альтернативної ознаки обчислюється як добуток часток:
, де d1 — частка елементів сукупності, яким властива ознака, d0 — частка решти елементів . Застосуємо основну формулу дисперсії до цих характеристик структури: .Якщо, скажімо, у збиральному цеху частка висококваліфікованих робітників становить d1= 0,2, то дисперсія частки
σ2=0,2 (1-0,2)=0,16.
Дисперсія альтернативної ознаки широко використовується при проектуванні вибіркових обстежень, обробці даних соціологічних опитувань, статистичному контролі якості продукції тощо. За відсутності первинних даних про розподіл сукупності припускають, що d1=d0=0,5 і використовують максимальне значення
дисперсії σ2 =0,5·0,5=0,25.
Якщо сукупність розбито на групи за певною ознакою х, то для будь-якої іншої ознаки у можна обчислити дисперсію як у цілому по сукупності, так і в кожній групі. Центром розподілу сукупності в цілому є загальна середня
, центром розподілу в j-й групі — групова середня . Відхилення індивідуальних значень ознаки у від загальної середньої можна подати як дві складові: . Узагальнюючими характеристиками цих відхилень є дисперсії: загальна, групова та міжгрупова.Загальна дисперсія характеризує варіацію ознаки у навколо загальної середньої:
.Групова дисперсія характеризує варіацію відносно групової середньої:
.Оскільки в групи об'єднуються певною мірою схожі елементи сукупності, то варіація в групах, як правило, менша, ніж у цілому по сукупності. Якщо причинні комплекси, що формують варіацію в різних групах, неоднакові, то й групові дисперсії різняться між собою.
Узагальнюючою мірою внутрішньогрупової варіації є середня з групових дисперсій:
.Різними є й групові середні
. Мірою варіації їх навколо загальної середньої є міжгрупова дисперсія .Отже, загальна дисперсія складається з двох частин. Перша характеризує внутрішньогрупову, друга — міжгрупову варіацію.
Взаємозв'язок дисперсій називається правилом розкладання (декомпозиції) варіації:
.40 Види статистичних графіків і способи їх побудови
Статистичні графіки і правила їх побудови
Внаслідок опрацювання даних різних видів спостережень дістають багато цифрового матеріалу, який розмішують у таблицях. Застосування табличного методу суттєво полегшує орієнтування в зібраному та згрупованому матеріалі. Проте здебільшого статистичні дослідження не обмежуються лише таблицями.
Таблична форма викладу кількісного матеріалу не завжди дає змогу достатньо наочно і чітко відобразити загальну картину стану чи розвитку якого-небудь явища, розкрити закономірності зв'язку статистичних показників або їхнього розподілу. А тому для розв'язання цих та інших завдань поряд із статистичними таблицями широко застосовують графічний спосіб зображення статистичних величин.
Статистичний графік — це спосіб наочного зображення й узагальнення статистичних даних про соціально-економічні явища процеси за допомогою геометричних образів, малюнків або схематичних географічних карт.
Графіки застосовують здебільшого для характеристики (порівняння) розвитку показників у часі й просторі, вивчення структури та структурних зрушень, контролю за виконанням планових завдань, характеристики розміщення і поширення явищ у просторі, а також для аналізу зв'язків і залежностей між різними показниками або між значеннями варіаційної ознаки і частотами чи частками. Для побудови статистичного графіка потрібно знати, з якою метою складається графік, вивчити вихідний матеріал та оволодіти методикою графічних зображень.
Основні елементи графіка: поле графіка, графічні образи, масштабні орієнтири та експлікація графіка. Кожний елемент має своє призначення і виконує відповідну роль у побудові й інтерпретації
Поле графіка — це простір, на якому розташовуються геометричні та інші знаки, тобто графічне зображення. Цей простір має певний розмір і обмежується або аркушем чистого паперу, або географічною чи контурною картою.
Розмір поля залежить від призначення графіка. В статистичних дослідженнях найчастіше застосовують графіки у вигляді прямокутників з нерівними сторонами по вертикалі і горизонталі, а також і графіки у вигляді квадратів. Співвідношення нерівних сторін полів графіка звичайно беруть від 1 : 1,33 до 1 : 1,50, якщо вертикальну сторону прийняти за 1.
Просторові орієнтири задають у вигляді прямокутної системи координат, тобто координатної сітки. В картограмах засобами просторової орієнтації є географічні карти.
Графічний образ — це сукупність різноманітних геометричних та графічних знаків, за допомогою яких відображують статистичні величини. У статистичних графіках використовують такі геометричні знаки, як крапки, відрізки прямих ліній, квадрати, прямокутники, кола, півкола, сектори, а також негеометричні знаки-символи у вигляді силуетів або малюнків. Це і є основою графіка, його мовою.
Масштабні орієнтири статистичних графіків — це масштаб, масштабні шкали і масштабні знаки, які використовуються для визначення розмірів геометричних та інших графічних знаків.
Масштаб — умовна міра переведення числового значення статистичного явища в графічне і навпаки. Тобто це довжина відрізка шкали, прийнята за числову одиницю. Наприклад, 1 см на графіку відповідає 1000 одиницям виробленої продукції, або 1 см2 дорівнює 100 км2 на досліджуваній території.