У випадку визначення врожайності жита частота врожайності 23-25ц\га становить 150, а 31-33 ц\га-250.
Врожайність,ц/га | 21-23 | 23-25 | 25-27 | 27-29 | 31-33 | 33-35 | Всього |
Площа, га | 100 | 150 | 250 | 300 | 250 | 150 | 1200 |
У випадку статистичного розподілу абітурієнтів частота результату 10 балів дорівнює 6, а 14 балів-3.
Для наочного зображення статистичного розподілу користуються графічним зображенням варіаційних рядів-діаграмами, графіками, гістограмою, полігоном та ін. Діаграми і графіки вам відомі. Розглянемо інші види графічного зображення.
Гістограма - це послідовність стовпців, кожний з яких спирається на один розрядний інтервал, а висота його відображає кількість випадків або частот у цьому розряді. Прийнято поширювати шкалу на один розрядний інтервал вправо і вліво від розглядуваного діапазону.
Ряди розподілу. Наочне зображення статистичного розподілу
Рядом розподілу називають ряд чисел, які характеризують розподіл одиниць досліджуваної сукупності. Ряд чисел, які характеризують розподіл одиниць досліджуваної сукупності залежно від величини ознаки, називається варіаційним рядом.
Нехай у даній статистичній сукупності вивчається деяка ознака, яка, взагалі кажучи, змінюється з переходом від одного члена статистичної сукупності до іншого. Зміну цієї ознаки називають її варіацією, а значення ознаки у даного члена статистичної сукупності – його варіантною.
Якщо здійснити групування варіант за окремими значеннями ознаки, матимемо дискретне групування (від латинського слова discretus – роздільний, перервний).
Наприклад, можна скласти дискретний варіаційний ряд за кількістю балів, отриманих абітурієнтами на вступних іспитах.
Нехай 35 абітурієнтів дістали на трьох екзаменах таку кількість балів: 10; 10; 11; 9; 15; 12; 9; 12; 13; 9; 8; 11; 14; 13; 12; 9; 10; 14; 10; 7; 8; 7; 9; 11; 15; 12; 7; 7; 8; 13; 13; 14; 10. Побудуємо статистичний розподіл цих даних.
Кількістьбалів | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
Кількістьабітурієнтів | 5 | 3 | 5 | 6 | 3 | 4 | 4 | 3 | 2 |
Побудову гістограми для графічного зображення інтервального варіаційного ряду здійснюють таким чином. На осі абсцис відкладають інтервали значень ознаки і на кожному з них, як на основі, будують прямокутник з висотою, пропорційною частоті інтервалу.
Розраховано, що кількість інтервалів має бути не меншою від 8 – 10 і не більшою від 20 – 25 при об’ємі статистичної сукупності n ≥ 50. У випадку дискретного розподілу на осі абсцис відкладають окремі значення ознаки.
Зазвичай вибирають шкали так, щоб ширина гістограми становила близько 1
її висоти, тобто щоб відношення висоти до ширини було приблизно 3 : 5. Середина стовпчика суміщається із серединою інтервалу розряду.На практиці прийнято зображувати гістограму у формі контуру, а не окремими стовпцями.
Побудова полігона розподілу нагадує побудову гістограми. У гістограмі кожний стовпчик закінчується горизонтальною лінією, причому на висоті, що відповідає частоті в цьому розряді. А в полігоні він закінчується точкою над серединою свого розрядного інтервалу на такій самій висоті.
Для побудови полігона варіаційного ряду на осі абсцис прямокутної системи координат відкладають інтервали значень ознаки і в серединах інтервалів ставлять перпендикуляри, довжини яких пропорційні відповідним частотам. Потім кінці сусідніх перпендикулярів з’єднують відрізками прямих, а кінці крайніх перпендикулярів з’єднують із серединами сусідніх інтервалів, частоти яких дорівнюють нулю. У результаті дістають замкнуту фігуру у вигляді многокутника, яку називають полігоном.
Приклад. За даними таблиці «Результати випробувань міцності ниток» побудуйте гістограму і полігон.
Результати випробувань міцності ниток
Міцністьнитки,Х | 120 –140 | 140 –160 | 160 –180 | 180 –200 | 200 –220 | 220 – 240 | 240 –260 | 260 –280 |
КількістьНиток, m | 1 | 4 | 10 | 14 | 12 | 6 | 2 | 1 |
Відкладаємо значення ознаки на осі абсцис, а частоти – на осі ординат (масштаб на обох осях вибираємо довільно). На відрізках осі абсцис, які відповідають побудованим інтервалам, будуємо прямокутники і дістаємо гістограму.
Щоб побудувати полігон, даний інтервальний ряд перетворимо на дискретний, обчисливши значення ознаки, що припадає на середину.
Міцністьнитки, Х | 130 | 150 | 170 | 190 | 210 | 230 | 250 | 270 |
Кількість ниток, m | 1 | 4 | 10 | 14 | 12 | 6 | 2 | 1 |
Часом замість гістограми чи полігона будують згладжену криву, яку проводять за точками настільки близько, наскільки це можливо.
Гістограма – найлегша для сприймання форма, тому їй надають перевагу, коли зображують не більше від одного розподілу. Але якщо треба порівняти два або більше розподілів, то для цього краще підходять полігони частот, бо їх можна накласти один на одного при меншій кількості перетинів ліній.
Мода і медіана
Ми вже бачили, що властивості сукупності даних можна подати у формі таблиць і графіків. Розглянемо деякі інші способи оцінювання даних за розподілом частот. Їх метою є, як прийнято говорити в статистиці, виявлення міри центральної тенденції (центрального положення).
Найпростіше знайти міру центральної тенденції за допомогою моди (від латинського слова modus – міра, правило).
Мода – це значення ознаки, яке трапляється найчастіше в даному ряді розподілу.
Для дискретних варіаційних рядів мода визначається як значення ознаки з найбільшою частотою. Наприклад, якщо в універмазі протягом дня продано 200 дитячих костюмчиків – 38 штук 22 розміру, 42 штуки 24 розміру, 56 штук 26 розміру, 18 штук 28 розміру, 33 штуки 30 розміру і 13 штук 32 розміру, то модальним номером є 26 – й, бо він має найбільшу чисельність.
Проте не кожна сукупність значень має єдину моду в строгому розумінні цього означення. В сукупності значень (3, 5, 5, 7, 8, 8, 8, 9) модою є число 8, бо воно трапляється частіше за будь-яке інше значення.
У випадку, коли всі значення в групі трапляються однаково часто, вважають, що група оцінок не має моди. Наприклад, у групі (1,2; 1,2; 1,7; 1,7; 4,8; 4,8) мо-ди немає.
Якщо два сусідні значення мають однакову частоту і вона більша від частоти будь-якого іншого значення, мода є середнє цих двох значень. Наприклад, мода групи значень (1, 2, 3, 3, 3, 4, 4, 4, 5) дорівнює 3,5 ((3 + 4) : 2). Якщо два несуміжні значення в групі мають рівні частоти і вони більші від частот будь-якого значення, то існує дві моди. Наприклад, у групі значень (7, 10, 10, 10, 11, 13, 14, 14, 14, 15) модами є 10 і 14.
Мода використовується, зокрема, у практиці торгівельної статистики під час визначення купівельного попиту на товари, рівня цін на ринках тощо.
Приклад. Білила цинкові найчастіше використовують художники в масляному живопису. Тому білу фарбу можна вважати модою сукупності фарб, що трапляються на палітрі. Цей факт враховують виробники фарб: білил цинкових випускають більше, ніж фарб інших кольорів.
Медіана – середня величина змінюваної ознаки, яка міститься всередині ряду, розміщеного в порядку зростання або спадання значень ознаки.
Отже,
Медіана – це значення змінюваної ознаки, яке ділить множину даних навпіл, так що одна половина значень більша від медіани, а друга –менша.
Якщо дані містять непарне число різних значень, наприклад 9, 11, 15, 18, 20, то медіана є середнім значенням для випадку, коли вони впорядковані, тобто медіана дорівнює 15. Якщо дані містять парне число різних випадків, наприклад 7, 11, 13, 15, то медіана дорівнює середньому між двома центральними значеннями, якщо вони впорядковані, тобто (11 + 13) : 2 = 12.
Приклад.
1. Знайти медіану сукупності даних:
а) 12, 2, 9, 11, 15, 24, 10;
б) 18, 43, 24, 17, 21, 26.
Розв’язання. а) Розмістимо дані сукупності в порядку зростання: 2, 9, 10, 11, 12, 15, 24; n= 7 – непарне число. М
= 11.б) Розмістимо дані в порядку зростання:
17, 18, 21, 24, 26, 43;
n = 6 – парне число. М
= = = 22,5.2. Результати контрольної роботи за матеріалом розділу дано в таблиці:
Оцінка, бал | 12 | 9 | 6 | 3 | Всього |
Частота | 11 | 9 | 2 | 20 | 42 |
Як можна оцінити якість знань учнів з цього розділу?
Розв’язання. Медіана ділить усі оцінки навпіл. Двадцять перший член дорівнює 3, двадцять другий член дорівнює 3. Медіана дорівнює
= 3. Бачимо, що із 42 оцінок 21 не перевищує 6, отже, половина оцінок складається з 3 і 6, що свідчить про незадовільну якість знань.Середні значення
Статистика оперує такими середніми значеннями: середне арифметичне, середнє квадратичне, середнє геометричне.
Середнє арифметичне. Нехай ми маємо n об’єктів, у яких виміряна деяка характеристика, що має значення х
, х ,…, х .