Таблица 6
Расчеты для вычисления дисперсий
Год | Московская область | Республика Башкортостан | Приморский край | Республика Ингушетия | ||||||||
2008 | 9030,4 | -404,9 | 163944,0 | 8360,0 | -312,2 | 97468,8 | 6262,0 | -203,6 | 41466,5 | 1392,1 | -109,2 | 11924,6 |
2009 | 9026,5 | -408,8 | 167117,4 | 8435,9 | -236,3 | 55837,7 | 6099,3 | -366,3 | 134200,1 | 1523,5 | 22,2 | 492,8 |
2010 | 10249,0 | 813,7 | 662107,7 | 9220,7 | 548,5 | 300852,3 | 7035,6 | 570,0 | 324862,0 | 1588,3 | 87,0 | 7569,0 |
Σ | 28305,9 | 993169,1 | 26016,6 | 454158,8 | 19396,9 | 500528,6 | 4503,9 | 20026,5 | ||||
9435,3 | 8672,2 | 6465,6 | 1501,3 |
Вычислим средние арифметические величины и внутригрупповые дисперсии по каждой группе.
Внутригрупповые дисперсии по каждой группе:
(11) (12) (13) (14)Средняя из внутригрупповых дисперсий:
(15)Вычислим межгрупповую дисперсию. Для этого предварительно определим общую среднюю как среднюю взвешенную из групповых средних:
(16)Межгрупповая дисперсия:
(17)Общая дисперсия по правилу сложения дисперсий:
(18)Эмпирическое корреляционное отношение:
(19)Величина эмпирического корреляционного отношения, равная 0,99, характеризует существенную связь между группировочным и результативным признаками.
Вариация (среднеквадратическое отклонение) значений признака внутри каждой группы незначительна и составляет:
в первой группе:
приво второй группе:
прив третьей группе:
прив четвертой группе:
приВариация значений признака между группами составляет
приИтак, после проведенного анализа дисперсий внутри каждой из образованных групп можно сказать, что потребительские расходы зависят от месторасположения региона, в котором потребляются товары и услуги.
Предположим, что потребительские расходы зависят от величины дохода. Проверим это предположение с помощью корреляционно-регрессионного анализа (КРА). КРА проведем с помощью программы MS Excel.
Этапы анализа:
1. Постановка цели исследования.
Определить наличие или отсутствие зависимости между показателями дохода и потребительских расходов. Построить регрессионную модель этой зависимости, проверить её качество и использовать эту модель для анализа и прогнозирования.
2. Сбор исходной статистической информации.
Информацию для исследования находим в статистических ежегодниках. Представим данные в табличной форме (таблица 7).
Таблица 7
Исходная информация для КРА
Годы | Доходы на человека в месяц, руб | Потребительские расходы на человека в месяц, руб |
2004 | 1736,3 | 1100,7 |
2007 | 4153,1 | 2311,5 |
2008 | 5156,0 | 2526,1 |
2009 | 6819,7 | 3308,9 |
2010 | 8866,8 | 4202,9 |
Введем обозначения: xi – доходы, yi – потребительские расходы. Графически зависимость исходных данных представлена на рисунке 4.
Рисунок 4 - Зависимость потребительских расходов от доходов
3. Оценка тесноты связи между признаками.
3.1. Предположим, что изучаемые признаки связаны линейной зависимостью. Рассчитаем линейный коэффициент корреляции по формуле:
Промежуточные расчеты представлены в таблице 8.
Таблица 8
Промежуточные расчеты для определения параметров регрессии
Годы | xi | yi | xy | x2 | y2 |
2004 | 1736,3 | 1100,7 | 1911145,41 | 3014737,69 | 1211540,5 |
2007 | 4153,1 | 2311,5 | 9599890,65 | 17248239,61 | 5343032,3 |
2008 | 5156 | 2526,1 | 13024571,6 | 26584336 | 6381181,2 |
2009 | 6819,7 | 3308,9 | 22565705,33 | 46508308,09 | 10948819 |
2010 | 8866,8 | 4202,9 | 37266273,72 | 78620142,24 | 17664368 |
∑ | 26731,9 | 13450,1 | 84367586,71 | 171975763,6 | 41548942 |
Коэффициент линейной корреляции, равный 0,997, свидетельствует о наличии очень сильной связи.
3.2. Оценка существенности коэффициента корреляции. Для этого найдем расчетное значение t-критерия Стьюдента:
(28)По таблице критических точек распределения Стьюдента найдем tкр при уровне значимости α=0,05 и числе степеней свободы ν = 5-k-1 = 5-1-1=3. tкр = 3,18. Так как tрасч > tкр (22,3> 3,18), то линейный коэффициент считается значимым, а связь между x и y – существенной.
4. Построение уравнения регрессии.
Этап построения регрессионного уравнения состоит в идентификации (оценке) его параметров, оценке их значимости и значимости уравнения в целом.
4.1. Идентификация регрессии. Построим линейную однофакторную регрессионную модель вида
Для оценки неизвестных параметров a0, a1 используется метод наименьших квадратов, заключающийся в минимизации суммы квадратов отклонений теоретических значений зависимой переменной от наблюдаемых (эмпирических).Система нормальных уравнений для нахождения параметров a0, a1 имеет вид: