Звичайно, одержані дані є множиною розташованих як завгодно чисел. У такій множині важко помітити яку-небудь закономірність їх варіювання. Щоб помітити таку закономірність (якщо вона є), дослідні дані піддають обробці. Наприклад, обробка результатів спостережень полягає в тому, що отримані наслідки спостережень розташовують у порядку не спадання. Така обробка називається ранжуванням дослідних даних.
Після ранжування дослідні дані легко об’єднати в групи так, щоб у кожній окремій групі дані були однаковими.
Приклад. На телефонній станції проводилися спостереження над числом Х неправильних з’єднань за хвилину. Спостереження протягом години дали такі результати: 3; 1; 3; 1; 4; 2; 2; 4; 0; 3; 0; 2; 2; 0; 2; 1; 4; 3; 3; 1; 4; 2; 2; 1; 1; 2; 1; 0; 3; 4; 1; 3; 2; 7; 2; 0; 0; 1; 3; 3; 1; 2; 4; 2; 0; 2; 3; 1; 2; 5; 1; 1; 0; 1; 1; 2; 2; 1;1; 5.
Розташуємо ці дані в порядку не спадання і згрупуємо їх. Дістанемо такий ранжируваний ряд даних спостережень:
0; 0; 0; 0; 0; 0; 0; 0; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 5; 5; 7.
Отримали 7 груп різних спостережень. Кожне таке значення, що належить різним групам, називають варіантом, а зміну цього значення – варіюванням.
Чисельність окремої групи згрупованого ряду даних називають частотою, або вагою відповідного варіанта і позначають m
, де і – індекс варіанта. Наприклад, для варіант х частота m = 10.Відношення частоти даного варіанта до загальної суми частот усіх варіантів називається частотою варіанта і позначається Р
, де і – індекс варіанта.Дискретним варіаційним рядом розподілу називається. Ранжирувана сукупність варіантів х
з відповідними їх частотами m або частостями Р .Результатами спостережень для наведеного прикладу (робота телефонної станції) зручно подати у вигляді таблиці
Індекс | і | 1 2 3 4 5 6 7 |
Число неправильних з’єднань за хвилину | х | 0 1 2 3 4 5 7 |
Частота | m | 8 17 16 10 6 2 1 |
Частість | Р |
У практиці статистично розрізняють три способи відбору одиниць сукупності, яка вивчається.
1) Випадковий відбір – усі одиниці сукупності мають однакову можливість потрапити до вибірки. Відбір здійснюється з усієї сукупності жеребкуванням.
2) Механічний відбір – одиниці спостереження відбирають у певному порядку. Наприклад, під час механічного відбору при вивченні якості продукції береться на вибір кожна десята або двадцята деталь.
3) Типовий відбір – усю масу одиниць, що вивчаються, розчленовують на дрібніші однорідні групи і здійснюють наступний відбір одиниць – «представників» кожної групи у випадковому або механічному порядку. Наприклад, під час вивчення бюджету сімей їх попередньо поділяють на групи за соціальним станом і рівнем прибутків.
Поширюючи дані вибіркового спостереження на всю генеральну сукупність, застосовують два способи поширених даних: спосіб прямого перерахунку і спосіб поправочних коефіцієнтів. Перший спосіб полягає в тому, що результати вибіркового спостереження приймають і для генеральної сукупності.
Другий спосіб застосовують під час уточнення результатів суцільного спостереження. Суть його полягає в тому, що дані вибіркового обстеження зіставляють з даними суцільного спостереження і визначають коефіцієнт розходження.
Спостереження основного масиву передбачає облік лише частини сукупності, яка має переважну питому вагу в обсязі досліджуваного об’єкта. Наприклад, вивчення цін на ринках, які мають найбільшу питому вагу в оборотах торгівлі.
Анкетне спостереження не надійне (частина анкет не повертається). Воно використовується переважно транспортними організаціями і органами зв’язку для вивчення ефективності обслуговування населення.
Монографічний опис полягає в тому, що для обстеження береться один об’єкт, який докладно вивчають (здебільше це має місце під час вивчення і поширення передового досвіду).
Важливу частину статистичних методів становлять планування і аналіз експериментів, спрямованих на виявлення і перевірку причинних зв’язків між змінними. Планування експериментів спирається в основному на поєднання теорії ймовірностей з елементарною логікою.
Статистичні дослідження проводяться за таким планом:
1) формулюється завдання дослідження і визначаються обсяг, місце і час потрібної перевірки;
2) здійснюються збирання необхідних даних та їх наочне подання;
3) проводиться обробка зібраного статистичного матеріалу.
На першому етапі важливо чітко визначити мету дослідження,встановити, які об’єми вивчатимуться і в якій кількості (обсяг вибірки). Необхідно встановити, які ознаки при цьому братимуться до уваги, які кількісні та якісні характеристики об’єктів слід оцінити.
На другому етапі використовують різні методи збирання даних: спостереження, порівняння, усне і письмове анкетування, систематизація даних.
На третьому етапі (частково на другому) результати статистичних досліджень піддають обробці і оформляють у вигляді таблиць, діаграм, графіків. За результатами виконаної роботи роблять певні висновки.
Статистичні висновки роблять від окремих властивостей вибірок до часткових властивостей сукупності; опис властивостей як вибірок, так і сукупностей здійснюється за допомогою методів описової статистики.
Описова статистика включає в себе табулювання (складання таблиць), подання і опис сукупності даних. Ці дані можуть бути або кількісними, як наприклад, вимірювання зросту і маси людини, або якісними, наприклад вивчення певних явищ, в яких принципове значення має стать.
Статистичні таблиці
Статистичні таблиці мають підмет і присудок.
Статистичний підмет-це та сукупність, про яку йдеться в таблиці.
Як правило, підмет розміщується у лівій частині таблиці.
Статистичний присудок - це ті ознаки або показники, які характеризують статистичний підмет.
Підмет розміщується в заголовках граф-стовпців.
За структурою підмета статистичні таблиці поділяються на прості, групові і комбінаційні.
Прості - підмет задається переліком окремих об єктів (назви підприємств, міст, країн і т.п.).
Групові - в підметі одиниці сукупності групуються за однією якоюсь ознакою.
Комбінаційні - в підметі одиниці групуються за двома і більше ознаками, пов’язаними між собою.
Наведемо приклади таблиць.
Оптимальна вологість ґрунтів
Грунт | Вологість, % |
ПіщанийСупіщанийПилуватийСуглинковийВажкий суглинковийГлинистий | 8 – 129 – 1516 – 2212 – 1516 – 2019 – 23 |
Зміни в пам’яті, увазі, швидкості реакції за день
Випробування, %вранішні вечірні | Різниця, % | ||
Пам'ятьОбсяг увагиШвидкість реакціїПомилки | 100100100100 | 79,372,783,4111,1 | - 20,7 - 27,3- 16,6-11,1 |
Співвідношення затрат робочого часу на виконання трудових функцій
Трудові функціїробітника | Питома вага відповідних елементівробочого часу, % | ||
Наладчик | Оператор | Наладчик токарних автоматів | |
Робочий часАктивне спостереження і регулювання режиму з пульту управлінняМашино-ручне управлінняСуте ручне працяНаладка, підна-ладка, зміна інструменту, контроль продукції | 10059,75,318,716,3 | 10033,946,016,33,8 | 10054,72,20,542,6 |
Якщо групування здійснено за інтервалами зміни ознаки, то таке групування називають інтервальним.
Наприклад, вибіркове вимірювання врожайності жита на площі 1200га дало результати, які ми подаємо за допомогою інтервального групування.
Залежність рівня автоматизації та освітньої структури персоналу,
який обслуговує автоматизоване обладнання, % загальної кількості
Кількість років освіти персоналу | Контроль, здійснюваний персоналом | Напівавто- матичний контроль | Автоматичнийконтроль зворотного зв’язку | Логічний контроль за допомогою системи зворотного зв’язку |
Менше за 88 – 1112Більше за 12 | 10 403515100 | 16403212100 | 5253733100 | 162469100 |
Подавши результат групування рядом варіант або інтервалів варіації, розміщених у зростаючій послідовності, і низкою відповідних частот, дістанемо варіаційний ряд (відповідно дискретний або інтервальний).
Частотою значення ознаки або інтервалу називають кількість членів сукупності з деякою варіантною або відповідно кількість членів сукупності, варіанти яких лежать у даному інтервалі.