Смекни!
smekni.com

Парная линейная регрессия, парная нелинейная регрессия, множественная регрессия, временные ряды (стр. 6 из 10)

Рисунок 2.14

Графически данная зависимость имеет вид:

Рисунок 2.15


3. Моделирование и идентификация множественной линейной регрессии

3.1. План работы

-в процессе выполнения данной работы необходимо

-синтезировать модель Монте-Карло множественной линейной регрессии (прямая задача).

-вычислить параметры множественной линейной регрессии (обратная задача идентификации).

-составить отчет по работе.

3.2. Модель Монте-Карло множественной линейной регрессии (прямая задача)

Уравнение множественной линейной регрессии.

Множественная линейная регрессия имеет вид

, где (3.1)

x1,x2,x3, …, xk, - независимые переменные,

y - зависимая переменная,

a,b1, b2, b3,…, bk- параметры модели.

В реальности на данную связь оказывает влияние множество других неконтролируемых факторов, в связи с чем данная связь представляется как:

,где (3.2)

e - случайное отклонение наблюдаемой зависимой переменной, вызванное влиянием других факторов. Уравнение (3.1) является основой статистического моделирования уравнения регрессии.

В рамках данной работы будет моделироваться и идентифицироваться модель третьего порядка:

3.2.1. Последовательность выполнения работы по моделированию.

Откроем новую книгу. Cохраним книгу в своей папке под именем МЛР. Xls (Множественная Линейная Регрессия).

Для данной задачи рекомендуется отменить режим автоматического пересчета листа. Для этого необходимо в «Сервис»\ «Параметры»\ «Вычисления» установить режим «вручную».

3.2.1.2. Сформируем заголовки для исходных данных модели (Рисунок 1.1):

- коэффициенты модели,a,b1, b2, b3,…, bk;

- среднее квадратическое отклонение погрешности СКОе;

- математическое ожидание независимых переменных Мх1, Мх2, Мх3,;

- среднее квадратическое отклонение независимых переменных СКОх1,СКОх2,СКОх3,

Ввести значения а, b1, b2, b3, CKOe (σе), Мх1, Мх2, Мх3,СКОх1, СКОх2, СКОх3, согласно варианту контрольной работы.

3.2.1.3. СКОе задать равным нулю.

Рисунок 3.1

3.2.1.4. Сформируем заголовки таблицы модели (Рисунок 3.1).

Выделим ячейки для:

i – номер наблюдения,

1 – единичный вектор (будет рассмотрен ниже),

х1, х2, х3 - значения переменных x1, x2, x3,

е – значение ошибки в текущем наблюдении e,

y – моделируемое факторное значения зависимой переменной y, определяемое независимыми переменными x1, x2, x3 и ошибкой e.

3.2.1.5. Моделирование двадцати наблюдения (Рисунок 3.2 (показаны первые 4 наблюдения))

Рисунок 3.2

Колонка единичного вектора заполняется единицами.

Случайные значения независимых переменных x1, x2, x3– моделируются аналогично предыдущему по формуле

, где (3.3)

Z - центрированная и нормированная случайная величина, распределенная по нормальному закону (MZ=0, σZ=1),

Mx, σx - математическое ожидание и среднее квадратическое отклонение независимой переменной.

Центрированная и нормированная случайная величина моделируется на основании центральной предельной теоремы путем 12-ти кратного сложения равномерно распределенных случайных чисел Ri в диапазоне (0,1].

(3.4)

Синтаксис функцией, возвращаемой случайное число, равномерно распределенное в диапазоне (0,1], имеет вид:

R=слчис().

Для моделирования независимой переменной необходимо в ячейку, где моделируется переменная x необходимо ввести формулу:

«=(слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()-6)*[ σx]+ [Mx]», где

[Mx] и [σx] - соответственно адреса ячеек, где заданы математическое ожидание и среднее квадратическое отклонение независимой переменной (ссылки на данные ячейки должны быть абсолютными).

Аналогично моделируется ошибка в текущем наблюдении e,

Факторное значения зависимой переменной y, определяемое независимыми переменными x1, x2, x3 и ошибкой eвычисляется по формуле (3.2).

3.2.1.6. Задав СКОе=0 (Ме=0) построим точечные графики зависимости у(х1), у(х2), у(х3) (Рисунок 3.3).

Рисунок 3.3

3.2.1.7. При СКОе=0 имеем отсутствие линейной связи y(x). Это объясняется тем, что внутри рассматриваемых случаев случайная природа образования зависимости имеет место существовать.

3.3. Идентификация модели множественной линейной регрессии

3.3.1. Основные положения процедуры идентификации параметров множественной линейной регрессии

Задачей идентификации и является нахождение таких значений a, b1, b2, b3, при которых сумма квадратов ошибки будет минимальна

(3.5)

На основании смоделированных значений наблюдений мы имеем следующую систему уравнений:

(3.6)

Где верхний индекс обозначает номер моделируемого наблюдения.

Если ввести следующие векторы и матрицу как:

, (3.7)

то система уравнений может быть записана в векторной форме:

(3.8)

Условие минимума квадрата ошибки в векторной форме будет иметь вид:

(3.9)

Данный минимум обеспечивается при условии равенства нулю производной:

где (3.10)

ХТ - транспонированная матрица Х.

Раскрывая скобки получаем:

(3.11)

Откуда вектор параметров модели будет определяться как:

(3.12)

3.3.2. Последовательность выполнения работы:

Для расчета элементов вектора В (состоящего из значений коэффициентов регрессионной модели) необходимо последовательно получим:

- транспонированную матрицу - ХТ,

- произведение - ХХТ,

- обратную матрицу – (ХХТ)-1,

- произведение - (ХХТ)-1 ХТ,

- произведение - (ХХТ)-1 ХТY,

3.3.2.1. Получим транспонированную матрицу ХТ.

Транспонированная матрица получается путем замены срок на столбцы,

Для получения транспонированной матрицы необходимо:

-выделим исходную матрицу

-кликнем по кнопке «Копирование»,

-кликнем на ячейку, в которой необходимо разместить транспонированную матрицу (20 столбов вправо и 5 строк вниз от нее ячейки должны быть свободными),

-выполним команду «Правка>Специальная вставкa».Поставим флажок «Транспонирование» и нажмем на клавишу ОК.

На рабочем поле появилась транспонированная матрица (Рисунок 3.4 - приводим лишь первые столбцы).