Смекни!
smekni.com

Эконометрика 8 (стр. 2 из 2)

Предположим, что мы нашли эти оценки и можно записать уравнение:

ŷ = a + bх,

где а - регрессионная постоянная, точка пересечения линии регрессии с осью OY;

b - коэффициент регрессии, угол наклона линии регрессии, характеризующий отношение DY¤DX;

ŷ - теоретическое значение объясняемой переменной.

Как известно в парной регрессии выбор вида математической модели может осуществляться тремя видами:

1. Графическим.

2. Аналитическим.

3. Экспериментальным.

Для выбора функции, описывающей наблюденные значения, можно использовать графический метод. Исходные данные наносятся на координатную плоскость. На оси абсцисс откладывают значения факторного признака, а на оси ординат - значения результирующего признака. Расположение точек покажет примерную форму связи. Как правило, эта связь является криволинейной. Если кривизна этой линии невелика, то можно принять гипотезу о существовании прямолинейной связи.

Функцию потребления изобразим в виде диаграммы рассеивания. Для этого в системе координат на оси абсцисс отложим значение дохода, а на оси ординат - расходы на потребление условно­го товара. Расположение точек, соответствующих наборам значений "доход - расход на потребление", покажет пример­ную форму связи (рисунок 1).

Визуально, по диаграмме, почти никогда не удаётся однозначно назвать наилучшую зависимость.

Перейдём к оценке параметров выбранной функции a и b способом наименьших квадратов.

Проблема оценивания может быть сведена к "классической" задаче отыскания минимума. Переменными теперь оказываются оценки а и b неизвестных параметров предполагаемой связи у и х. Для отыскания наименьшего значения какой-либо функции сначала надо найти частные производные I порядка. Затем каждую из них приравнять нулю и разрешить полученную систему уравнений относительно переменных. В нашем случае такой функцией является сумма квадратов отклонений - S, а переменными - а и b. То есть мы должны найти = 0 и = 0 и разрешить полученную систему уравнений относительно а и b.

Выведем оценки параметров по методу наименьших квадратов, предполагая, что уравнение связи имеет вид ŷ = a + bх. Тогда функция S имеет вид

. Дифференцируя функцию S по а, мы получаем первое нормальное уравнение, дифференцируя по b - второе нормальное уравнение.

,

,

После соответствующих преобразований получим:

(*)

Существуют упрощенные правила построения системы нормальных уравнений. Применим их к линейной функции:

1) Перемножим каждый член уравнения ŷ = a + bх на коэффициент при первом параметре (а), то есть на единицу.

2) Перед каждой переменной поставим знак суммирования.

3) Свободный член уравнения умножим на n.

4) Получим первое нормальное уравнение

5) Перемножим каждый член исходного уравнения на коэффициент при втором параметре (b), то есть на х.

6) Перед каждой переменной ставим знак суммирования.

7) Получаем второе нормальное уравнение

По этим правилам составляется система нормальных уравнений для любой линейной функции. Правила впервые были сформулированы английским экономистом Р. Перлом.

Параметры уравнений рассчитываются по следующим формулам:

,

,

Построим, используя исходные данные в таблице 1 , систему нормальных уравнений (*) и решим ее относительно неизвестных а и b:


1677=11*a+4950*ba = -3309

790 400=4950*a+2 502 500*bb = 7,6923

Уравнение регрессии имеет вид:

ŷ =-3309 + 7,6923 х,

Сравним фактические и расчетные расходы на потребление товара А (таблица 2).

Таблица 2 Сравнение фактических и расчетных значений расходов на потребление товара А при прямолинейной зависимости:

№ группы

Расходы на потребление

товара А

Отклонение фактических расходов от расчетных

фактические (у)

расчетные

(ŷ)

абсолютные

(у – ŷ)

1 120 -1770,54 1890,54
2 129 -1385,92 1514,92
3 135 -1001,31 1136,31
4 140 -616,45 756,45
5 145 -232,08 377,08
6 151 152,53 -1,53
7 155 537,15 -382,15
8 160 921,76 -761,76
9 171 1306,38 -1135,38
10 182 1690,99 -1508,99
11 189 2075,61 -1886,61
всего - - 0

Построим график полученной функции ŷ и диаграмму рассеивания, используя фактические значения (y) и расчётные (ŷ) .

Расчетные значения отклоняются от фактических в силу того, что связь между признаками корреляционная.

В качестве меры тесноты взаимосвязи используется коэффициент корреляции:

r =

=

Получим, используя исходные данные из таблицы 1:

σx =158;

σy = 20,76;

r = 0,990.

Линейный коэффициент корреляции может принимать любые значения в пределах от минус 1 до плюс 1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи - прямой зависимости соответствует знак плюс, а обратной зависимости – знак минус.

Вывод:связь между значениями х и соответствующими значениями у

тесная, прямая зависимость.

Кроме того, можно рассчитать коэффициент детерминации d, который равен квадрату коэффициента корреляции.

В нашем примере d = 0,9801

Это значит, что изменение расходов на товар А можно на 98,01 % объяснить изменением дохода.

Остальные 1,99 % могут явиться следствием:

1) недостаточно хорошо подобранной формы связи;

2) влияния на зависимую переменную каких-либо других неучтенных факторов.

Статистическая проверка гипотез.

Выдвигаем ноль-гипотезу о том, что коэффициент регрессии статистически незначим:

H0: b = 0.

Статистическая значимость коэффициента регрессии проверяется с помощью t-критерия Стьюдента. Для этого сначала определяем остаточную сумму квадратов

s2ост=å(yi – ŷi)2

s2ост = 1,3689.

и ее среднее квадратическое отклонение

s=

s = 0,39.

Затем определим стандартную ошибку коэффициента регрессии по формуле:

se(b)= 0,018.

Фактическое значение t-критерия Стьюдента для коэффициента регрессии:

.

tb = 427,35.

Значение |tb|>tкр (tкр=2,26 для 95% уровня значимости) позволяет сделать заключение об отличии от нуля (на соответствующем уровне значимости) коэффициента регрессии и, следовательно, о наличии влияния (связи) х и у.

Вывод:фактическое значение t-критерия Стьюдента превышает табличное, значит ноль-гипотеза отклоняется и с вероятностью 95% принимается альтернативная гипотеза о статистической значимости коэффициента регрессии.

Далее построим 95% доверительный интервал для коэффициента регрессии b:

[b – tкр*se(b), b + tкр*se(b)]- 95% доверительный интервал для b.

Доверительный интервал накрывает истинное значение параметра bc заданной вероятностью (в данном случае 95%).

7,6516 < b < 7,7329.

Перейдем к проверке статистической значимости коэффициентов корреляции и детерминации:

r = 0,990;

d = r2 = 0,9801.

Выдвигаем ноль-гипотезу о том, что уравнение регрессии в целом статистически незначимо:

H0: r2= 0.

Оценка статистической значимости построенной модели регрессии в целом производится с помощью F-критерия Фишера. Фактическое значение F-критерия для уравнения парной регрессии, линейной по параметрам определяется как:

где s2фактор–дисперсия для теоретических значений ŷ (объясненная вариация);

s2ост - остаточная сумма квадратов;

r2- коэффициент детерминации.

Фактическое значение F-критерия Фишера:

Fф = 443,26

Вывод:отклоняем ноль-гипотезу и с вероятностью 95% принимаем альтернативную гипотезу о статистической значимости уравнения регрессии.