Смекни!
smekni.com

Парная линейная регрессия, парная нелинейная регрессия, множественная регрессия, временные ряды (стр. 3 из 10)

Ftable(1,n-2,α) - табличное значение F-критерия для степеней свободы 1 (числитель), n-2 (знаменатель),α - уровень значимости.

Гипотеза о наличии связи между y и x принимается если

(1.23)

1.4.2. Порядок выполнения проверки нулевой гипотезы:

1.4.2.1. Сделаем копию листа и озаглавим его «Существенность параметров».

1.4.2.2. Сформируем заголовки таблицы модели (Рисунок 1.12).

1.4.2.3. Выделим ячейки для расчета:

- средних квадратов отклонений на одну степень свободы (Dcom, Dfact, Drem),

- коэффициента детерминации D через суммы квадратов отклонений,

- средних квадратов отклонений,

- F-отношения, через средние квадратов отклонений на одну степень свободы,

- F-отношения, через коэффициент детерминации,

- табличного значения F-критерия,

1.4.2.4. Сформируем заголовки строк для расчета сумм квадратов отклонений.

Рисунок 1.12

1.4.2.5. Рассчитаем суммы квадратов отклонений (Sfact, Srem, Scom).

1.4.2.6. Рассчитаем средние квадраты отклонений на одну степень свободы (1.20, 1.21, 1.22).

1.4.2.7. Рассчитаем коэффициент детерминации D через суммы квадратов отклонений:

(1.24)

1.4.2.8. Вычислим F-отношение через средние квадратов отклонений на одну степень свободы (1.23),

1.4.2.9. Вычислим F-отношения, через коэффициент детерминации:

1.4.2.10. Вычислим табличное значение F-критерия,

Введем табличное значение F-критерия для уровня значимости а = 0,05, воспользовавшись стандартной функцией из статистической категории Fобр (FINV) с тремя аргументами: (уровень значимости; степень свободы числителя F-отношения; степень свободы знаменателя F-отношения). Для нашего случая в ячейку табличного значения F-критерия заносится формула «=FINV(0,05;1;98)»

1.4.2.11. Из данных вычислений получили:

Так как Ftable < F, то гипотеза Но о наличии связи между x и y принимается.

1.4.2.12. При увеличении ошибки регрессионной модели е, F-отношение уменьшается, что говорит об ослаблении связи между x и y, что, в конце концов, приводит к разрыву этой связи. Тогда гипотеза Но о наличии связи между x и y отвергается. (Рисунок 1.12а, Рисунок 1.12б)

Рисунок 1.12а

Рисунок 1.12б

1.4.2.13. При ошибке регрессионной модели, при которой нулевая гипотеза отвергается идентифицированная линия регрессии намного отклоняется от заданной.

1.5. Оценка доверительных интервалов линии регрессии и прогноза зависимой переменной.

1.5.1. Основные положения:

Стандартная ошибка в оценках параметров а и b определяется как:

(1.25)

(1.26)

Соответственно, доверительные интервалы для фактических коэффициентов bf и af будут:

(1.27)

Стандартное отклонение для линии регрессии определяется как:

(1.28)

Соответственно, доверительные интервалы для линии регрессии определяются как:

(1.29)

Стандартная ошибка прогноза определяется формулой по полученной линии регрессии определяется как:

(1.30)

Доверительные границы прогноза определяются как:

(1.31)

1.5.2. Последовательность выполнения процедуры оценки доверительных интервалов:

1.5.2.1. Скопируем лист и озаглавим его «Доверительные интервалы».

1.5.2.2. Сформируем заголовки таблицы модели:

Рисунок 1.13

1.5.2.3. Выделим ячейки (Рисунок 1.13) для расчета:

- стандартных ошибок оценки коэффициента b и a (CKOb, CKOa),

- значения t-критерия Стьюдента для коэффициентов b и a (tb, ta),

- табличного значения t-критерия (tinv),

- верхних и нижних доверительных интервалов (Дов.инт. НГ, ВГ).

1.5.2.4. Рассчитаем стандартные ошибки в оценке коэффициентов линии регрессии mb, ma (1.27, 1.28).

1.5.2.5. Рассчитаем фактические значения t-критерия Стьюдента по формулам:

(1.32)

1.5.2.6. Введем функцию расчета табличного значения t-критерия.

Аргументы функции: доверительная вероятность (α) и число степеней свободы (n-2).

1.5.2.7. Сопоставляя фактические и табличные значения t-критерия Стьюдента модели b и a и выдвинув гипотезу Но (о статистической незначимости параметров, т.е. a=b=rxy=0), делаем вывод:

т.к. ta>tтабл, tb< tтабл, то b-незначим, а не случайно отличается от нуля, а сформировалось под влиянием систематически действующей произвольной.

1.5.2.8. Рассчитаем верхние и нижние значения коэффициентов b и a для уровня значимости α=0,05 (1.29).

1.5.2.9. Добавим колонки с расчетом нижней и верхней границы линии регрессии (Рисунок 1.14).

Расчет производится по формулам (1.30, 1.31).

(При вводе формул обращаем особое внимание, на то, какие ссылки должны быть абсолютными, а какие - относительными).

Рисунок 1.14

1.5.2.10. Построим точечные графики зависимости полученной линии регрессии и доверительных интервалов для различных значений ошибки σе (Рисунок 1.15).

Рисунок 1.15

1.5.2.11. Как видно на графике, при увеличении значений ошибки σе границы доверительных интервалов увеличиваются и наоборот, что говорит об ослаблении связи между x и y.

1.5.2.12. Добавим колонки с расчетом нижней и верхней границы линии прогноза зависимой переменной для уровня значимости α=0,05 (Рисунок 1.16). Доверительные границы прогноза зависимой переменной вычисляются по формулам (1.32, 1.33).

Вначале получим столбец значений СКО (1.32). После этого получить значения нижней и верхней границ (1.33). Данные интервалы учитывают статистический характер оценок коэффициентов b и a. Однако для больших объемов наблюдений значение в формуле (1.30).

относительно малы по сравнению с единицей. В этой связи оценка стандартной ошибка прогноза может быть определена как:

(1.33)

Рисунок 1.16

Доверительные интервалы в этом случае будут строиться аналогично. Однако следует учесть, что они справедливы лишь для конкретного набора зависимой и независимой переменных, т.е. для конкретных идентифицированных значений коэффициентов b и a.

1.5.2.13. Изменяя ошибку модели получим несколько доверительных границ прогноза.

Рисунок 1.17

1.5.2.14. Из рисунка видно, что с увеличением границ прогноза связь между x и y ослабевает под влиянием ошибки σе. на линии регрессии.

1.6. Идентификация с помощью функции «Линейн» («LINEST») ППП Excel. Для идентификации с помощью функции «Линейн» («LINEST») ППП Excel необходимо:

-выделим массив ячеек 2х5 (Рисунок 1.18).

-вызовем функцию «линейн».

-введем 4 аргумента:

-массив y

-массив x

-константа а – ИСТИНА

-статистические характеристики – ИСТИНА