Парная регрессия (стр. 1 из 2)

Контрольная работа

по теме: "Парная линейная регрессия"

Данные, характеризующие прибыль торговой компании "Все для себя" за первые 10 месяцев 2004 года (в тыс. руб.), даны в следующей таблице:

январь	февраль	март	апрель	май	июнь	июль	август	сентябрь	октябрь
367	418	412	470	485	470	525	568	538	558

В контрольной работе с использованием табличного процессора Ехсеl необходимо выполнить следующие вычисления и построения:

1. Построить диаграмму рассеяния.

2. Убедится в наличии тенденции (тренда) в заданных значениях прибыли фирмы и возможности принятия гипотезы о линейном тренде.

3. Построить линейную парную регрессию (регрессию вида

). Вычисление коэффициентов b₀, b₁выполнить методом наименьших квадратов.

4. Нанести график регрессии на диаграмму рассеяния.

5. Вычислить значения статистики F и коэффициента детерминации R². Проверить гипотезу о значимости построенного уравнения регрессии.

6. Вычислить выборочный коэффициент корреляции и проверить гипотезу о ненулевом его значении.

7. Вычислить оценку дисперсии случайной составляющей эконометрической модели.

8. Проверить гипотезы о значимости вычисленных коэффициентов b₀, b₁.

9. Построить доверительные интервалы для коэффициентов b₀, b₁.

10. Построить доверительные интервалы для дисперсии случайной составляющей эконометрической модели.

11. Построить доверительную область для условного математического ожидания М(

)( по оси Х откладывать месяцы январь - декабрь). Нанести границы этой области на диаграмму рассеяния.

12. С помощью линейной парной регрессии сделать прогноз величины прибыли на ноябрь и декабрь месяц и нанести эти значения на диаграмму рассеяния. Сопоставить эти значения с границами доверительной области для условного математического ожидания М(

) и сделать вывод о точности прогнозирования с помощью построенной регрессионной модели.

Решение.

Используя исходные данные, строим диаграмму рассеяния:

На основе анализа диаграммы рассеяния убеждаемся в наличии тенденции увеличения прибыли фирмы и выдвигаем гипотезу о линейном тренде.

Полагаем, что связь между факторами Х и У может быть описана линейной функцией

. Решение задачи нахождения коэффициентов b₀, b₁основывается на применении метода наименьших квадратов исводится к решению системы двух линейных уравнений с двумя неизвестными b₀, b₁:

b₀n + b₁ Уx_i = Уy_i,

b₀Уx_i + b₁ Уx_i² = Уx_iy_i.

Составляем вспомогательную таблицу:

№	х	y	x²	ху	y²
1	1	367	1	367	134689
2	2	418	4	836	174724
3	3	412	9	1236	169744
4	4	470	16	1880	220900
5	5	485	25	2425	235225
6	6	470	36	2820	220900
7	7	525	49	3675	275625
8	8	568	64	4544	322624
9	9	538	81	4842	289444
10	10	558	100	5580	311364
сумма	55	4811	385	28205	2355239

Для нашей задачи система имеет вид:

Решение этой системы можно получить по правилу Крамера:

Получаем:

Таким образом, искомое уравнение регрессии имеет вид:

y =364,8 + 21,145x.

4. Нанесем график регрессии на диаграмму рассеяния.

5. Вычислим значения статистики F и коэффициента детерминации R².Коэффициент детерминации рассчитаем по формуле R² = r_xy²= 0,952² = 0,907. Проверим адекватность модели (уравнения регрессии) в целом с помощью F-критерия. Рассчитаем значение статистики Fчерез коэффициент детерминации R² по формуле:

Получаем:

. Зададим уровень значимости б =0,01, по таблице находим квантиль распределения Фишера F_0,01;1;8 = 11,26, где 1 – число степеней свободы.

F_факт. > F_0,01;1;8, т.к. 78,098 > 11,26.

Следовательно, делаем вывод о значимости уравнения регрессии при 99% - м уровне значимости.

6. Вычислим выборочный коэффициент корреляции и проверим гипотезу о ненулевом его значении.

Рассчитаем выборочный коэффициент корреляции по формуле:

Получаем:

Проверка существенности отличия коэффициента корреляции от нуля проводится по схеме:если

, то гипотеза о существенном отличии коэффициента корреляции от нуля принимается, в противном случае отвергается.

Здесь t_1-б/2,_n_-2– квантиль распределения Стьюдента, б - уровень значимости или уровень доверия, n – число наблюдений, (n-2) – число степеней свободы. Значение б задается. Примем б = 0,05, тогда t_1-б/2,_n_-2= t_0,975,8= 2,37. Получаем:

Следовательно, коэффициент корреляции существенно отличается от нуля и существует сильная линейная связь между х и у.

С использованием табличного процессора Ехсеl проведем регрессионную статистику:

Вывод итогов:

Регрессионная статистика
Множественный R	0,952409
R-квадрат	0,907083
Нормированный R-квадрат	0,895468
Стандартная ошибка	21,7332
Наблюдения	10

Дисперсионный анализ
df	SS	MS	F	Значимость F
Регрессия	1	36888,245	36888,25	78,09816	2,119E-05
Остаток	8	3778,6545	472,3318
Итого	9	40666,9

Коэфф.	Станд. ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	364,8	14,846599	24,57128	8,04E-09	330,56368	399,0363
Переменная X 1	21,14545	2,3927462	8,837316	2,12E-05	15,627772	26,66314

Вычисленные значения коэффициентов b₀, b₁,значения статистики F, коэффициента детерминации R²выборочного коэффициента корреляции r_xy совпадают с выделенными в таблице.

7. Оценка дисперсии случайной составляющей эконометрической модели вычисляется по формуле

Используя результаты регрессионной статистики, получаем:

8. Проверим значимость вычисленных коэффициентов b₀, b₁по t-критерию Стьюдента. Для этого проверяем выполнение неравенств:

где

Используем результаты регрессионной статистики:

Коэффициенты	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	364,8	14,846599	24,57128	8,04E-09	330,56368	399,0363
Переменная X 1	21,14545	2,3927462	8,837316	2,12E-05	15,627772	26,66314

Получаем:

;

Примем б = 0,05, тогда t_1-б/2,_n_-2= t_0,975,8= 2,37.

Так как

, делаем вывод о значимости коэффициентов линейного уравнения регрессии.

9. Доверительные интервалы для коэффициентов b₀, b₁ получаем с помощью результатов регрессионной статистики.

Доверительный интервал для коэффициента b₀уравнения регрессии: