Данное учебно-методическое пособие содержит курс лабораторных работ, которые позволяют научиться решать эконометрические задачи, используя программные продукты. Каждая лабораторная работа содержит необходимые понятия и формулы. Данная информация является дополнительным теоретическим материалом, и ни в коем случае не может восприниматься как учебник по эконометрике. Изучить теоретическую часть можно на основании любого учебника по эконометрике, например работы [2; 4]. Название лабораторных работ совпадает с название параграфов книги [5].
Изучать данные лабораторные работы рекомендуется непосредственно работая на ЭВМ с соответствующим программным продуктом. При этом очень важно самостоятельно выполнять все описываемые действия.
Кроме обычных учебников по эконометрике, имеется огромное количество полезной информации в сети Internet. Список наиболее популярных интернет-ресурсов находится в библиографическом списке.
Глава 1. МОДЕЛЬ ПАРНОЙ РЕГРЕССИИ
Основные понятия математической статистики
Цель: изучить возможности электронной таблицы Excel по обработки статистической информации.
Основные формулы и понятия:
Если X и Y — две произвольные случайные величины, то для них можно определить некоторые параметры, например
mX,mY — математические ожидания;
— дисперсия; — среднеквадратичное отклонение случайной величины;— ковариация случайных величин;
— корреляция случайных величин;Если X дискретная случайная величина, которая принимает n значений (х1,х2,...,хn) с вероятностями (p1,p2,...,pn), то
— математическое ожидание;
— дисперсия;Если имеется выборка (х1,х2,...,хn) из генеральной совокупности, в которой каждый элемент является случайной величиной, то нельзя определить точное значение теоретических характеристик, однако можно построить точечные оценки, которые по возможности должна быть отвечать требованиям несмещённости, состоятельности и эффективности.
Основные оценки:
— выборочное среднее (несмещённая оценка математического ожидания m);
— выборочная дисперсия (смещённая оценка дисперсии);— несмещённая оценка дисперсии;
— выборочная ковариация; — выборочная корреляция.Электронная таблица Excel
Во всех электронных таблицах имеется большое количество встроенных статистических функций. Excel не стал исключением из правил. Статистические функции, как и любые другие функции, вставляются с помощью мастера функций посредством пункта меню Вставка, Функции или нажатием на кнопку
панели инструментов. Мастер функций выполняется в два этапа: на первом задается функция (все описываемые функции находятся в категории «Статистические»), а на втором этапе выбираются аргументы данной функции.Рассмотрим основные статистические функции. При этом необходимо отметить одну особенность. Для решения одной задачи имеется две практически одинаковые функции, например, СРЗНАЧ и СРЗНАЧА, вычисляют среднее значение в выборке. Первая функция игнорирует все ячейки, в которых содержится нечисловая информация, а вторая всем ячейкам с текстовой информацией автоматически придает значение 0. Аналогично для вычисления всех значений имеются две функции, при этом первая игнорирует все нечисловые ячейки, а вторая, заканчивающая на А, автоматически придает всем ячейкам, в которых находится текстовая или логическая информация, значение 0.
Функция ДИСПР вычисляет значение выборочной дисперсии, которая является смещённой оценкой реальной дисперсии. Иногда данное значение называют дисперсией для генеральной совокупности. Среднеквадратичное отклонение может быть вычислено как корень квадратный из дисперсии или посредством использования функции СТАНДОТКЛОН. Функция ДИСП вычисляет значения несмещённой оценкой дисперсии, которую также называют дисперсией по выборке, а для определения среднеквадратичного отклонения можно использовать функцию СТАНДОТКЛОНА. Все вышеперечисленные функции в качестве аргументов имеют один массив данных.
Функции КОВАР и КОРЕЛЛ вычисляют ковариацию и корреляцию между двумя массивами данных, а следовательно, аргументами данных функций являются два блока данных одинаковой размерности.
Рассмотрим пример использования данных функций. Исходные данные, в которых содержатся цена и спрос на некоторый товар, представлены в таблице 1.
Таблица 1
Номер наблюдения | Цена x (р.) | Спрос y (тыс.шт.) |
1 | 15,09р. | 125,1779 |
2 | 15,21р. | 123,8094 |
3 | 15,28р. | 121,175 |
4 | 15,49р. | 116,9143 |
5 | 15,54р. | 119,8643 |
6 | 15,62р. | 118,0681 |
7 | 15,70р. | 123,5887 |
8 | 15,91р. | 117,0877 |
9 | 15,92р. | 116,1699 |
10 | 15,95р. | 118,3436 |
11 | 16,31р. | 116,2008 |
12 | 16,33р. | 111,4565 |
13 | 16,60р. | 115,1026 |
14 | 16,69р. | 110,1056 |
15 | 16,76р. | 110,0231 |
Тогда документ Excel, в котором вычисляются значение выборочного среднего, выборочных дисперсий, а также корреляции и ковариации, может иметь вид, представленный в таблице 2.
Таблица 2
A | B | C | |
1 | Номер наблюдения | Цена x (р.) | Спрос y (тыс.шт.) |
2 | 1 | 15,09р. | 125,1779 |
3 | 2 | 15,21р. | 123,8094 |
4 | 3 | 15,28р. | 121,175 |
5 | 4 | 15,49р. | 116,9143 |
6 | 5 | 15,54р. | 119,8643 |
7 | 6 | 15,62р. | 118,0681 |
8 | 7 | 15,70р. | 123,5887 |
9 | 8 | 15,91р. | 117,0877 |
10 | 9 | 15,92р. | 116,1699 |
Продолжение табл. 2
11 | 10 | 15,95р. | 118,3436 |
12 | 11 | 16,31р. | 116,2008 |
13 | 12 | 16,33р. | 111,4565 |
14 | 13 | 16,60р. | 115,1026 |
15 | 14 | 16,69р. | 110,1056 |
16 | 15 | 16,76р. | 110,0231 |
17 | Выборочное среднее по x | =СРЗНАЧ(B2:B16) | |
18 | Выборочное среднее по y | =СРЗНАЧ(C2:C16) | |
19 | Выборочная дисперсия x | =ДИСП(B2:B16) | |
20 | Выборочная дисперсия y | =ДИСП(C2:C16) | |
21 | Ковариация | =КОВАР(B2:B16;C2:C16) | |
22 | Корреляция | =КОРРЕЛ(B2:B16;C2:C16) |
Вычисленные на основании этих формул значения будет равны:
Выборочное среднее по x = 15,89
Выборочное среднее по y = 117,53
Выборочная дисперсия x = 0,29
Выборочная дисперсия y = 22,34
Ковариация = –2,12
Корреляция = –0,88
Анализируя полученные результаты, можно только говорить о том, что разброс значений по y больше, чем разброс по x, поскольку значение дисперсии y намного больше дисперсии x, и зависимость между x и y близка к линейной убывающей зависимости, поскольку коэффициент корреляции отрицательный и по модулю близок к единице.
Основная особенность электронных таблиц заключается в том, что рабочее поле представляет собой совокупность ячеек, у каждой из которых имеется свой адрес. Функция заносится в определенную ячейку, в которую возвращается полученное значение. Для решения многих статистических и эконометрических задач использование только функций является существенным ограничением, поскольку часто результатом должно служить не одно число, а некоторый набор. С целью расширения возможностей в Excel реализованы надстройки, которые подключатся по мере необходимости и позволяют решать более специфические задачи.