Смекни!
smekni.com

Кореляційний і регресивний методи аналізу зв язку (стр. 1 из 2)

Реферат з вищої математики

на тему:

Кореляційний і регресивний

методи аналізу звязку.


Основне завдання кореляційного і регресійного методів полягає в аналізі статистичних даних для виявлення математичної залежності між досліджуваними ознаками і встановлення за допомогою коефіцієнта кореляції порівняльної оцінки щільності взаємозв’язку.

Після того, як через економічний аналіз встановлено, що зв’язок між явищами є, і визначено загальний характер цього зв’язку, статистика за допомогою кореляційного і регресійного методів надає цим зв’язкам числового виразу.

Кореляційний і регресій ний методи аналізу вирішують два основні завдання :

- визначають за допомогою рівнянь регресії аналітичного форму зв’язку між

варіацією ознак XiY,

- встановлюють ступінь щільності зв’язку між ознаками.

Найчастіше трапляються такі типи кореляційних зв’язків:

- факторна ознака безпосередньо пов’язана з результативною,

- результативна ознака визначається комплексом діючих факторів,

- дві результативні ознаки спричинені дією однієї загальної причини.

У практиці економіко-статистичних досліджень часто доводиться мати справу з прямолінійною формою зв’язку яку описує рівняння регресії ( рис.1 ) .

На цьому графіку середній арифметичній результативної ознаки Y відповідає пряма, паралельна осі абсцис, лінійне кореляційне рівняння Y(X) зображує похила пряма, а кут нахилу між ними характеризує щільність зв’язку.

Рівняння регресії характеризує зміну середнього рівня результативної ознаки Y залежно від зміни факторної ознаки X. Воно визначає математичне сподівання групових середніх результативної ознаки під впливом різних значень факторної ознаки.

У разі лінійної форми зв’яку результативна ознака змінються під впливом факторної ознаки рівномірно:

Ŷx = a0 +a1 X,

Де, Ŷx- згладжене середнє значення результативної ознаки , X - факторна ознака,

a0і a1- параметри рівняння , a0 – значення Y при X= 0,a1– коефіцієнт регресії.

Коефіцієнт регресіїa1,вказує на те, наскільки змінюється результативна ознака Y внаслідок зміни факторної ознаки X на одиницю.

Якщо a1 має позитивний знак,то зв’язок прямий, якщо від’ємний - зв’язок обернений.


Y X

Y(X)


Y

0

X

Рис. 1. Теоретична лінія регресії.

Параметри рівняння зв’язку визначають за способом найменших квадратів складеної і роз’язаної системи двох рівнянь з двома невідомими:

SY= na0 +a1 SX ,

SYX= a0 SX + a1 SX 2,

деn - число членів у кожному з двох порівнюваних рядів,

SX - сума значень факторної ознаки ,SX2 - сума кадратів значень факторної ознаки ,SY - сума значень результативної ознаки, SYX - cума добутків значень факторної та результативної ознак.

Рзв’язавши дану систему рівнянь, дістанемо такі параметри:

SX 2 SY - SX SXY n SXY - SXSY

a0 = , a1 =

nSX 2 - SXSX nSX 2 - SXSX

Обчисливши за фактичними даними всі записані вище суми й підставивши їх у наведені формули, знайдемо параметри прямої.

Рз\озглянемо розрахунок параметрів лінійного рівняння зв’язку між вартістю основних виробничих фондів і випуском продукції за даними десяти однорідних підприємств. (табл.1.)

Табл. 1

Розрахунки для визначення параметрів лінійного рівняння звязку факторної та результативної ознак.

Номер

заводу

Вартість основних виробничих фондів X,

млн. грн

Випуск продукції Y, млн. грн X 2 XY Y2 Yx = 0.167+0.421X

1

2

3

4

5

6

7

8

9

10

12

8

10

6

9

15

11

13

14

10

5,6

4,0

4,0

2,4

3,6

5,0

4,6

6,5

7,0

4,5

144

64

100

36

81

225

121

169

196

100

67,2

32,0

40,0

14,4

32,4

75,0

50,6

84,5

98,0

45,0

31,36

16,00

16,00

5,76

12,96

25,00

21,16

42,25

49,00

20,25

5,2

3,5

4,4

2,7

4,0

6,5

4,8

5,6

6,1

4,4

Разом 108 47,2 1236 539,1 239,74 47,2
У середньому на один завод 10,8 4,72 123,6 53,91 23,972 -

За способом найменших квадратів визначемо параметри :

1236 · 47.2 – 108 · 539.1 58339.2 – 58222.8 116.4

a0 = = = = 0.167

10 · 1236 – 108 · 108 12360 – 11664 696.0

10 · 539.1 – 108 · 47.2 5391.0 – 5097.6 293.4

a1 = = = = 0.421

696.0 696.0 696.0

Тоді лінійне рівняння регресії зв’язку між вартістю основних виробничих фондів і випуском продукції матиме такий вигляд :

Ŷx = 0.167 + 0.421X.

Отже, при збільшенні вартості основних виробничих фондів на 1 млн грн. Випуск продукції зросте на 0,42 млн грн.

Послідовно підставляючи в дане рівняння значення факторної ознаки X , дістанемо згладжені значення результативної ознаки Ŷx, які й укажуть на те, яким має бути середній розмір випущеної продукції для даного розміру основних виробничих фондів ( за інших рівних умов ).

Згладжені ( теоретичні ) значення ( із заокругленням до десятих ) наведено в останній графі табл. 1.Якщо параметри рівняння визначено правильно,то

SY= SŶх = 47,2.

Побудуємо графік, який покаже згладжування емпіричних даних рівняння прямої ( рис.1.).

Y


Рис. 2. Емпіричний і згладжені рівні ряду : 1 - Y, 2 - Ŷx =0.167+ 0.421 X, 3- Y = 4.72

Для економічної інтерпретації лінійних і нелінійних зв’язків між двома досліджуваними явищами часто використовують розраховані за рівняннями регресії коефіцієнти еластичності.

Коефіцієнт еластичності показує,на скільки процентів зміниться в середньому результативна ознака Y при зміненні факторної ознаки X на 1 %.

Відповідно до лінійної залежності коефіцієнт еластичності визначається за формулою

XX

e = a1 або e = a1 ,

ŶxY

де e, коефіцієнт еластичності.

Підставивши в формулу різні значення X, дістанемо різні e.

У наведеному прикладі коефіцієнт еластичності на першому підприємстві при X= 12:

X 12

e1 = a1 = 0.421· = 0.97. Отже, 1% приросту вартості основних виробничих

ŶX5.2

9

фондів випуск продукції зростає на 0,97%.На п’ятому підприємстві при X=9: e5 =0.421· = 0.95,

4

На десятому при X = 10: e10 =0.96%.

Для всіх підприємств разом коефіцієнт еластичності

X 10.8

e= a1 = 0.421 · = 0.963 % .

Y 4.72

Це означає, що при збільшенні середньої вартості основних виробничих фондів на 1 % випуск продукції зростає в середньому на 0,963 %.

Якщо залежність між ознаками представити за даними,згладженими параболою другого порядку, то коефіцієнт еластичності має такий вигляд:

X

e= (a1 + a2 X ) .

Y

Визначення щільності зв’язку в кореляційно-регресійному аналізі ґрунтується на правилі додавання дисперсій,як і в методі аналітичного групування. Але на відміну від нього, де для оцінки лінії регресії застосовують групові середні результативної ознаки, в кореляційно-регресійному аналізі для цієї мети використовують теоретичні значення результативної ознаки.

Зобразити і обґрунтувати кореляційно-регресійний аналіз можна на прикладі графіка на рис.1. На ньому є три лінії Y – ламана лінія фактичних даних(1),ŶX - пряма похила лінія 2 теоретичних значень Y при абстрагуванні від впливу всіх факторів, крім фактора X(змінна середня) ,Y – пряма горизонтальна лінія 3, із середнього значення якої виключено вплив на Y всіх без винятку факторів ( стала середня ).

Розбіг лінії змінної середньої Ŷх з лінією сталої середньої Y пояснюється впливом факторної ознаки Х, що,в свою чергу , свідчить про існування між ознаками Y і X наповного не функціонального зв’язку.Для визначення щільності цього зв’язку потрібно обчислити дисперсію відхилень Y і Ŷх , тобто залишкову дисперсію,яка зумовлена впливом усіх факторів, крім Х. Різниця між загальною і залишковою дисперсіями дає теоретичну

( факторну ) дисперсію, яка вимірює варіацію,зумовлену фактором Х . На зіставленні цієї різниці із загальною дисперсією побудовано індекс кореляції, або теоретичне кореляційне відношення:

s2 заг - s2 е s2 еs2 у

R = Ö = Ö1 - , або R = Ö

s2 заг sзагs2 заг

де s2 заг - загальна дисперсія,s2 е - залишкова дисперсія,s2 у - факторна ( теоретична ) дисперсія.

Факторну дисперсію обчислюють з теоретичних значень за формулою :

S ( Ŷx-Y) 2

s2Ŷ =

n

або за формулою без теоретичних значень: