Смекни!
smekni.com

Статистическая проверка гипотез (стр. 6 из 8)

По виду корреляционной таблице можно судить о виде корреляционной зависимости.

Вычислим середины частичных интервалов

;

i=1,…,n; j=1,…,m.

Внесем найденные значения в корреляционную таблицу. По таблице вычислим оценки математических ожиданий и дисперсий

;
;

;
;

;
;

.

Коэффициент линейной корреляции определяются по формуле:


.

Для простоты вычислений обычно используют замену переменных:

;
;

где С1 и С2 – значения xi* и yj* соответствующие максимальной частоте

. Желательно, чтобы клетка с данной частотой находилась в середине таблицы. Точку (С12) называют ложным нулем. Переменные U и V – принимают значения: 0; ±1; ±2,…

,
,
,

;
.

При вычислениях используем, что

;
.

Коэффициент корреляции вычисляется по формуле:

.

Вернемся к исходным переменным:

;
;

;
.

Уравнения регрессии:

;
.

Графики функций пересекаются в точке

.

Пример:

Даны результаты 78 экспериментов:

X Y X Y X Y X Y
73 -291 57 -219 61 -241 68 -264
69 -270 71 -281 62 -243 62 -240
72 -279 66 -262 63 -245 70 -277
72 -282 76 -302 71 -282 70 -279
65 -254 70 -275 65 -252 65 -253
67 -264 68 -267 70 -276 70 -275
56 -216 74 -290 70 -276 63 -248
70 -276 68 -266 63 -246 63 -243
63 -248 71 -283 73 -284 67 -264
64 -253 60 -237 68 -271 68 -267
70 -276 56 -222 59 -227 55 -213
67 -262 71 -281 64 -256 56 -218
60 -234 68 -269 79 -309 58 -223
80 -313 66 -257 77 -300 70 -278
71 -278 60 -235 78 -310 59 -236
74 -292 70 -275 66 -255 68 -263
68 -271 69 -276 63 -252 69 -268
65 -256 72 -282 69 -274 63 -243
73 -291 70 -277 74 -291 70 -271
63 -243 69 -270

Начало первого интервала x0 = 53, y0 = –321;

Длина интервала h1 = 5, h2 = 17.

1. Построить корреляционное поле для 4-ых столбцов X и Y и методом “натянутой нити” найти линейные функции регрессии.

2. Составить корреляционную таблицу. Вычислить коэффициент линейной корреляции, найти уравнения регрессий и построить их графики.

3. Проверить гипотезу о незначимости коэффициента корреляции.

Решение.

1. По последним столбцам X и Y находим:

xmin=55; ymin=-279;

xmax=70; ymax=-213;

На осях отображаем тот промежуток, где находятся значения X и Y. Представляя в виде точек пары чисел (x1; yj) строим корреляционное поле:

Используя метод “натянутой нити”, проведём прямую. На прямой выберем две точки (57, -220) и (69, -270), расположенные достаточно далеко друг от друга.. Подставляя значения в функцию y=ax+b, получим систему уравнений относительно a и b.

,

Получим решение a = - 4,17; b = 17,69. Уравнение линейной регрессии имеет вид: y = - 4,17 x + 17,69.

2. Найдём минимальные и максимальные значения X и Y среди результатов эксперимента:

xmin=55; ymin=-313; xmax=80; ymax=-213;

Составим корреляционную таблицу с шагом h1=5 по X и h2=17 по Y. Учитываем, что левая граница входит в интервал, а правая нет.

Клетка в шапке сверху содержит границы интервала по Y [yj, yj+1], значение середины интервала yj* и значение середины интервала для условной переменной V. Клетка в шапке слева содержит границы интервала по X [xi, xi+1], значение середины интервала xi* и значение середины интервала для условной переменной U.

Произвольная клетка таблицы содержит число результатов

, попавших в соответствующие интервалы. В нижней строке записываются суммы чисел в столбцах. В крайнем левом столбце – суммы чисел в строках.

Таблица 8.

Y,V X,U [321,-304) -312,5; -2 [304,-287) -295,5; -1 [287,-270) -278,5; 0 [270,-253) -261,5; 1 [253,-236) -244,5; 2 [236,-219) -227, 5; 3 [219,-202) -210,5 ; 4 nx nu
[53,58) 55,5;-3 . 1 . . . . 4 5
[58,63) 60,5;-2 . . . . 4 . . . . 5 9
[63,68) 65,5;-1 . . . . 9 . . . . . 11 20
[68,73) 70,5;0
.. 24
. . . . 9 33
[73,78) 75,5;1 . . . . 7 . 1 8
[78,83) 80,5;2 . . . 3 3
ny, nv 3 7 25 18 15 6 4 78

Переход к условным вариантам.

;
;

C1=70,5; С2=-278,5 – координаты клетки с максимальным числом результатов экспериментов.

,
,…,
;

,
,…,
;

Вычисляем средние:

.

Вычислим среднее квадратов:

.

Вычислим среднее квадратическое отклонение:

;
;

;