Смекни!
smekni.com

Выборочная ковариация (стр. 1 из 2)

Министерство Образования Российской Федерации

Алтайский Государственный Университет

Экономический Факультет

Заочное отделение

Кафедра «Информационные системы в экономике»

Контрольная работа по предмету:

«Эконометрика»

Выполнил студент

3 курса 211 группы

Неклюдов А.А.

Барнаул 2003 г.


Выборочная ковариация

Выборочная ковариация является мерой взаимосвязи между двумя переменными. Данное понятие может быть продемонстрировано на простом примере. Просматривая табличные данные, помещенные в приложении книги: «Введение в эконометрику», Кристофера Доугерти можно увидеть, что в период между 1963 и 1972 гг. потребительский спрос на бензин в США устойчиво повышался. Эта тенденция прекратилась в 1973 г., а затем последовали нерегулярные колебания спроса с незначительным его падением в целом. В табл. 1.1 приведены данные о потребительском спросе и реальных ценах после нефтяного кризиса. (Реальная цена вычисляется путем деления индекса номинальной цены на бензин, на общий индекс потребительских цен и умножением результата на 100, из таблицы дефляторов цен для личных потребительских расходов(1972 = 100%)). Индексы из таблицы дефляторов основаны на данных 1972 г.; таким образом, индекс реальной цены в таблице 1.1 показывает повышение цены бензина относительно общей инфляции начиная с 1972 г.

Таблица 1.1

Потребительские расходы на бензин и его реальная цена в США
Год Расходы(млрд. долл., цены 1972 г.) Индекс реальных цен (1972=100)
1973 26,2 103,5
1974 24,8 127,0
1975 25,6 126,0
1976 26,8 124,8
1977 27,7 124,7
1978 28,3 121,6
1979 27,4 179,7
1980 25,1 188,8
1981 25,2 193,6
1982 25,6 173,9

Можно видеть некоторую отрицательную связь между потребительским спросом на бензин и его реальной ценой. Показатель выборочной ковариации позволяет выразить данную связь единичным числом. Для его вычисления сначала необходимо найти средние значения цены и спроса на бензин. Обозначив цену через p и спрос – через y, находим средние значения p и y, затем для каждого вычисляем отклонение величин p и y от средних и перемножаем их. Проделаем это для всех годов выборки и возьмем среднюю величину, она и будет выборочной ковариацией (Таблица 1.2).

Таблица 1.2
Наблюдение Ценаp Спросy _(p-p) _(y-y) _ _(p-p)(y-y)
1973 103,5 26,2 -39,86 -0,07 2,79
1974 127,0 24,8 -16,36 -1,47 24,05
1975 126,0 25,6 -17,36 -0,67 11,63
1976 124,8 26,8 -18,56 0,53 -9,84
1977 124,7 27,7 -18,66 1,43 -26,68
1978 121,6 28,3 -21,76 2,03 -44,17
1979 149,7 27,4 6,34 1,13 7,16
1980 188,8 25,1 45,44 -1,17 -53,16
1981 193,6 25,2 50,24 -1,07 -53,76
1982 173,9 25,6 30,54 -0,67 -20,46
Сумма: 1433,6 262,7 -162,44
Среднее: 143,36 26,27 -16,24

Итак, при наличии n наблюдений двух переменных (x и y) выборочная ковариация задается формулой:

Cov(x,y) = 1/n*S(xi-x)(yi-y) = 1/n{(xi-x)(yi-y)+…+(xn-x)(yn-y)}

Следует отметить, что в данном примере ковариация отрицательна. Так это и должно быть. Отрицательная связь в данном примере выражается отрицательной ковариацией, а положительная связь – положительной ковариацией.

Так, например, в наблюдении за 1979 г. (p-pсредн.) = 6,34, (y-yсредн.) = 1,13, а поэтому и их произведение положительно и равно 7,16, в этом наблюдении значения реальной цены и спроса выше соответствующих средних значений следовательно, наблюдение дает положительный вклад в ковариацию.

В наблюдении за 1978 г. реальная цена ниже средней, а спрос выше среднего, поэтому (p-pсредн.) отрицательно, (y-yсредн.) положительно, их произведение отрицательно, и наблюдение вносит отрицательный вклад в ковариацию.

В наблюдении за 1974 г., как реальная цена, так и спрос, ниже своих средних значений, таким образом, (p-pсредн.) и (y-yсредн.) оба являются отрицательными, а их произведение положительно следовательно, наблюдение вносит положительный вклад в ковариацию.

И, наконец, в наблюдении за 1981 г. цена выше средней, а спрос ниже среднего. Таким образом (p-pсредн.) положительно, (y-yсредн.) отрицательно, поэтому (p-pсредн.)(y-yсредн.) отрицательно, и в ковариацию, соответственно, вносится отрицательный вклад.

Несколько основных правил расчета ковариации.

· Правило 1

Если y = v+w, то Cov(x,y) = Cov(x,v)+Cov(x,w).

· Правило 2

Если y = az, где a – константа, то Cov(x,y) = aCov(x,z)

· Правило 3

Если y = a, где a – константа, то Cov(x,y) = 0

Демонстрация правила 1

Возьмем данные по шести семьям (домохозяйствам), приведенные в таблице 1.3: общий годовой доход (x); расходы на питание и одежду (y); расходы на питание (v) и расходы на одежду (w). Естественно, y равняется сумме v и w. Указанную в таблице величину z рассмотрим для демонстрации правила 2.

Таблица 1.3

Семья Доход семьи(x) Расходы на питание и одежду(y) Расходы на питание(v) Расходы на одежду(w) Вторая выборка: расходы семьи на питание и одежду(z)
1 3000 1100 850 250 2200
2 2500 850 700 150 1700
3 4000 1200 950 250 2400
4 6000 1600 1150 450 3200
5 3300 1000 800 200 2000
6 4500 1300 950 350 2600
Сумма: 23300 7050 5400 1650 14100
Среднее: 3883 1175 900 275 2350

В таблице 1.4 величины (x-x), (y-y), (v-v) и (w-w) вычисляются для каждой семьи. Отсюда получаем (x-xсредн.)(y-yсредн.), (x-xсредн.)(v-vсредн.) и (x-xсредн.)(w-wсредн.) для каждой семьи. Cov(x,y) получается как среднее из величин (x-xсредн.)(y-yсредн.) и равняется 266250. Cov(x,v) равна 157500 и Cov(x,w) = 108750. Следовательно, Cov(x,y) является суммой Cov(x,v) и Cov(x,w).

Таблица 1.4

Семья _x-x _y-y _ _(x-x)(y-y) _(v-v) _ _(x-x)(v-v) _(w-w) _ _(x-x)(w-w)
1 -883 -75 66250 -50 44167 -25 22083
2 -1383 -325 449583 -200 276667 -125 172917
3 117 25 2917 50 5833 -25 -2917
4 2117 425 899583 200 529167 175 370416
5 -583 -175 102083 -100 58333 -75 43750
6 617 125 77083 50 30833 75 46250
Сумма: 1597500 945000 652500
Среднее: 266250 157500 108750

Демонстрация правила 2

В таблице 1.3 последняя колонка (z) дает расходы на питание и одежду для второго множества из 6 семей. Каждое наблюдение z фактически представляет собой удвоенное значение y. Предполагается, что значения величины x для второго набора семей являются такими же, как и ранее. Для вычисления Cov(x,z) необходимы значения (x-xсредн.), а также (z-zсредн.)

Таблица 1.5

Семья (x-x) (z-z) (x-x)(z-z)
1 -883 -150 132500
2 -1383 -650 899167
3 117 50 5833
4 2117 850 1700167
5 -583 -350 204167
6 617 250 154167
Сумма: 3195000
Среднее: 532500

Из таблицы 1.5 можно видеть, что Cov(x,z) равна 532500, что в точности равно удвоенной Cov(x,y).

Демонстрация правила 3

Допустим, что каждая семья в выборке имеет по два взрослых человека, и предположим, что по недоразумению мы решили вычислить ковариацию между общим доходом (x) и числом взрослых в семье (a). Естественно, что a1=a2=…=a6=2. Таким образом, aсредн .= 2. Отсюда для каждой семьи (a-aсредн.) = 0 и, следовательно, (x-xсредн.)(a-aсредн.) = 0. Поэтому Cov(x,a) = 0.

Теоретическая ковариация

Если x и y – случайные величины, теоретическая ковариация sxyопределяется как математическое ожидание произведения отклонений величин от их средних значений:

pop.cov(x,y) =xy= E{(x)(y-y)}

Если теоретическая ковариация неизвестна, то для ее оценки может использована выборочная ковариация, вычисленная по ряду наблюдений. К сожалению такая оценка ,будет иметь отрицательное смещение.

Если x и y независимы, то их теоретическая ковариация равна нулю, поскольку:

E{(xx)(yy)} = E(xx)(yy) = 0*0

Выборочная дисперсия.

Для выборки из n наблюдений x1,…,xn выборочная дисперсия определяется как среднеквадратичное отклонение в выбоке:

Var(x) = 1/nS(x-x)2

Замечание. Определеннаятаким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии s2, которая определяется как:

1/(n-1)S(x-x)2, является несмещенной оценкой s2. Отсюда следует, что ожидаемое значение величины Var(x) равно [(n-1)/n]s2 и, следовательно, она имеет отрицательное смещение. Отметим, что если размер выборки n становится большим, то (n-1)/n стремится к единице и, таким образом, математическое ожидание величины Var(x) стремится к s2.

Правила расчета дисперсии.

· Правило 1

Если y = v+w, то Var(y) = Var(v)+Var(w)+2Cov(v,w)

· Правило 2

Если y = az, где a является постоянной, то Var(y) = a2Var(z)

· Правило 3

Если y = a, где a является постоянной, то Var(y) = 0

· Правило 4

Если y = v+a, где a является постоянной, то Var(y) = Var(v)

Следует заметить, что дисперсия переменной x может рассматриваться как ковариация между двумя величинами x:

Var(x) = 1/n*(xi-x)2 = 1/n*(xi-x)(xi-x) = Cov(x,x)