Смекни!
smekni.com

Методологія обробки статистичних даних (стр. 3 из 3)

3. Відтак, провівши спостереження, згідно зі складеним планом для кожної відстані перевезень отримаємо чотири значення обсягу перевезень (табл. 3.2), на підставі яких , відповідно, виводиться їх середнє значення.


Таблиця 3.2

Обсяги перевезень руди

Відстань

перевезення

x

, км

Обсяг перевезення

y

, т/зміну

Норма виробітку

yзм, т/зміну

2,2 26 27,5 26 24,5 26,00
2,8 23,7 25,3 22,3 22,3 23,40
3,4 21,6 22,8 21,2 20,8 21,60
4 19,8 20,6 20,1 19,4 20,00
4,9 18,1 19,9 19 18 18,75
5,4 16,6 18,1 18,1 16,8 17,40
6 15,2 16,4 17,2 15,7 16,00
7,5 14 14,9 16,3 14,7 15,00

4. Отримані норми виробітки є результатом збалансування умов експерименту і можуть бути використані для управління випадковими параметрами процесу транспортування через їх відповідність закономірності розподілу випадкових величин.


Завдання № 4

Регресійна модель. Коефіцієнти детермінації і кореляції

З використанням середньостатистичних даних, отриманих у результаті виконання завдання 3, встановіть кореляційну залежність будь-якого техніко-економічного показника діяльності організації (підприємства, виробничого підрозділу, механізму тощо) від однієї з керованих факторних перемінних (ознак), які впливають на цей показник. З цією метою виконайте наступне:

1) побудуйте графічну залежність;

2) виберіть форму рівняння зв’язку для описання вказаної залежності;

3) встановить коефіцієнти рівняння кореляції та напишіть це рівняння;

4) оцініть тісноту зв’язку між ознаками, що корелюють, для чого розрахуйте коефіцієнт кореляції, його похибку та надійність;

5) сформулюйте висновок стосовно можливості використання одержаного рівняння кореляції для прогнозування показника, який розглядається у цьому завданні.

Виконання завдання

У результаті проведення дослідження були отримані результати спостережень за обсягом перевезень руди автомобілями на різну відстань (табл.4.1). Необхідно встановити залежність між обсягом виробітку автомобіля (y) та відстанню перевезень (x) і перевірити отриману залежність показників на адекватність.

1. Будується графічна залежність за результатами спостережень у вигляді графіку функції y = f (x), що проходить через точки перетину всіх наявних даних досліджуваних ознак (рис. 4.1).


Таблиця 4.1

Обсяги перевезень на різну відстань

Відстань перевезення, x, км

Норма виробітку

yзм, т/зміну

2,2 26
2,8 23,4
3,4 21,6
4 20
4,9 18,75
5,4 17,4
6 16
7,5 15

Рис. 4.1. Залежність обсягу виробітку від відстані перевезення

2. Виходячи з рис. 4.1 є очевидним, що між показниками існує лінійна залежність типу y = а + bx: поступове збільшення відстані перевезення обумовлює відповідне зменшення обсягу виробітку.

3. Визначаються коефіцієнти регресії а та b за формулами (4.1) і (4.2). Отримано: b = - 1,5, a = 26,6. Отже, рівняння регресії має наступний вигляд: y = -1,5x + 26,6.

4. Розраховується коефіцієнт кореляції ознак, що досліджуються, за формулою (4.3). Для встановленого рівняння регресії r = 0,98, що свідчить про дуже тісний зв’язок між факторним та результативним показниками.

Встановлюється погрішність коефіцієнту кореляції та його надійність за виразами відповідно (4.4) та (4.5). Ці характеристики дорівнюють: S

= 0,08, М = 12,25.

5. Отриманий коефіцієнт кореляції, а також його погрішність та надійність свідчать про стійкий зв’язок між корельованими ознаками, що робить модель парної кореляції придатною для використання у практичних розрахунках норми виробітку.


Завдання № 5

Виявлення грубих помилок

1. Введіть у сукупність середньостатистичних даних, отриманих у результаті виконання завдання 4, один результат спостережень, що за величиною дуже відрізняється від загальної закономірності зміни даних, яку відображає сукупність.

2. З урахуванням цього результату (грубої помилки чи промаху), встановіть кореляційну залежність техніко-економічного показника від факторної перемінної у порядку, визначеному в завданні 4:

а) побудуйте графічну залежність;

б) виберіть форму рівняння зв’язку для описання вказаної залежності;

в) встановіть коефіцієнти рівняння кореляції та напишіть це рівняння;

г) оцініть тісноту зв’язку між ознаками, що корелюють, для чого розрахуйте коефіцієнт кореляції, його похибку та надійність;

3. Оцініть, наскільки змінилися показники тісноти зв’язку між ознаками, що досліджуються, при наявності в статистичній залежності грубих помилок, для чого отримані показники порівняйте з відповідними показниками в завданні 4 ;

4. Викладіть методику виявлення грубих помилок;

5. Здійсніть перевірку можливості вилучення результату спостережень, який дуже відрізняється від загальної закономірності зміни даних, із статистичної сукупності даних.

6. Сформулюйте висновок стосовно одержаного результату перевірки.

Виконання завдання

1. Підставимо замість одного показника статистичної сукупності, отриманої у завд. 3, інший показник, з метою його перевірки на відповідність закономірності розподілу даних, а саме, замість значення обсягу виробітку 16 т/зміну (табл. 4.1), яка відповідає відстані транспортування 6 км, обсяг виробітку, рівний 25 т/зміну (табл. 5.2).

Таблиця 5.2

Обсяги перевезень на різну відстань

Відстань перевезення, x, км

Норма виробітку

yзм, т/зміну

2,2
2,8 23,4
3,4 21,6
4 20
4,9 18,75
5,4 17,4
6 25
7,5 15

2-3. Встановлюємо кореляційну залежність між ознаками, що дослід-жуються, та порівнюємо її показники з аналогічними показниками, отриманими у завд. 4:

а) побудуємо графік функції залежності досліджуваних ознак:

Виходячи з рис. 5.1 видно, що значення 25 т/зміну, яке перевіряється, порушує загальну тенденцію зміни функції. Отже, його треба перевірити на достовірність;

б) припускається, що побудований графік функції описує лінійну залежність типу у= а + bx;

в)визначаються коефіцієнти регресії а та b за формулами (4.1) та (4.2), приведеними у п. 3 завд. 4: b = - 1, a = 25,3. Отже, рівняння регресії має наступний вигляд: y = -x + 25,3. У той же час, рівняння регресії до заміни одного результату спостережень мало вигляд: y = -x + 25,3. Отже, цей показник спричинив суттєве порушення зв’язку досліджуваних ознак;


Рис. 5.1. Залежність обсягу виробітку від відстані перевезення

г) розраховується коефіцієнт кореляції ознак, що досліджуються за формулою (4.3):r =0,4 , що свідчить про послаблення зв’язку між факторним та результативним показниками проти r =0,98 за попереднього розрахунку.

Встановлюється погрішність коефіцієнту кореляції S

= 0,4 та його надійність М = 1, відповідно, за формулами (4.4) та (4.5). Відтак, погрішність коефіцієнту кореляції проти S
= 0,08 зросла, а надійність проти М =12,25 – зменшилась, що вказує на необхідність перевірки зазначеного результату спостережень на його адекватність встановленої раніше закономірності розподілу даних.

4. Описується, яким чином необхідно перевірити статистичну сукупність на наявність грубої помилки.

5. Здійснюється перевірка статистичної сукупності на наявність помилкового значення, згідно з методикою:

а) розраховується критичне значення критерію Шовене для наявної сукупності усереднених даних:

Pш =1/(2∙8) = 0,0625.

б) визначається ймовірне відхилення сукупності даних за формулою (5.2):

ν =2,75.

в) обраховується показник точності даних вибірки за формулою (5.3):

η = 0,17.

г) встановлюється за формулою (5.4) величина відхилення показника, що перевіряється, від середнього значення статистичної сукупності: y

= 9,5 ;

д) встановлюється за табл. 5.1 вірогідність Pηy

потрапляння відхилення у інтервал від + 0,17∙9,5 до – 0,17∙9,5:

Pηy

= 0,966;

е) визначається вірогідність непотрапляння Py

відхилення у заданий інтервал за формулою (5.5):

Py

= 1- 0,952 = 0,034.

6. Висновок: Так-як вірогідність непотрапляння заданого відхилення ознаки 0,048 є меншою критичного значення Шовене, яке для даної сукупності обсягів перевезення дорівнює 0,0625, то показник обсягу перевезення 25,0 т/зміну повинен бути виключеним із статистичної вибірки.