2. Для построения интервального вариационного ряда выполняем следующие действия:
1. Сервис - Анализ данных - Гистограмма - ОК
2. Входной интервал – B4:B29
3. Выходной интервал – А43
4. Интегральный процент – Активизировать
5. Вывод графика – Активизировать
6. ОК
В итоге получаем (табл. 3):
Карман | Частота | Интегральный % |
1 | 3.85% | |
580.694 | 3 | 15.38% |
1092.848 | 12 | 61.54% |
1605.002 | 6 | 84.62% |
2117.156 | 1 | 88.46% |
2629.31 | 3 | 100.00% |
Предварительно перейдя от нижних границ к верхним (табл. 4): удалим значение ячейки A44, а вместо «Ещё» введем максимальное значение первого признака.
Таблица 4. Интервальный ряд распределения областей по степени износа основных фондов в отрасли - строительство
Группа областей по степени износа основных фондов в отрасли - строительство | Число областей в группе | Накопленная частость группы.% |
68.54-580.69 | 4 | 19.23% |
580.69-1092.85 | 12 | 61.54% |
1092.85-1605.00 | 6 | 84.62% |
1605.00-2117.16 | 1 | 88.46% |
2117.16-2629.31 | 3 | 100.00% |
Итого | 26 |
В процессе статистического исследования необходимо решить ряд задач:
1. Установить наличие корреляционной связи между признаками Х и Yметодом аналитической группировки.
Построив аналитическую таблицу, отражающую результаты аналитической группировки совокупности по факторному признаку Степень износа основных фондов в отрасли – строительство, можно установить наличие корреляционной связи.
Ранжируем исходные данные.
1.Выделить исходные данные табл. 2.1 (А4:С33);
2.Данные => Сортировка;
3.Сортировать по <= Степень износа основных фондов в отрасли – строительство
4.по возрастанию/по убыванию– устанавливается в положение по возрастанию;
5.Затем и В последнюю очередь по – не активизируются;
6.Идентифицировать поля по подписям/обозначениям столбцов листа – устанавливается в положение подписям
7.ОК.
В результате указанных действий в таблице 2.1 размещаются данные, ранжированные по возрастанию признакаСреднегодовая стоимость основных производственных фондов.
Распределяем регионы по группам.
1.Из всего диапазона отсортированных данных A4:C33 выделить мышью диапазон ячеек первойгруппы, для чего необходимо отсчитать в ранжированном ряду количество строк, соответствующее числу предприятий первой группы (графа 3 табл.2.2),
2.Нажать на панели инструментов кнопку
;3.Выбрать цвет по собственному усмотрению;
4.Выполнить действия 1–3 для всех групп, выбирая контрастные цвета для цветовой заливки очередной группы.
В итоге получаем таблицу 2.1. следующего вида:
Таблица 2.1. Исходные данные
Регионы России | Степень износа основных фондов в отрасли – строительство, млн. руб. | Стоимость основных фондов в отрасли - строительство, млн. руб. |
Республика Ингушетия | 68.54 | 149.00 |
Курская область | 216.90 | 1446.00 |
Калининградская область | 384.71 | 747.00 |
Ивановская область | 386.60 | 1065.00 |
Новгородская область | 674.08 | 1314.00 |
Республика Карелия | 700.74 | 1530.00 |
Калужская область | 733.04 | 1870.00 |
Брянская область | 758.01 | 1919.00 |
Липецкая область | 797.87 | 1797.00 |
Тверская область | 814.43 | 1642.00 |
Тамбовская область | 836.61 | 1855.00 |
Мурманская область | 899.16 | 1905.00 |
Псковская область | 907.41 | 2030.00 |
Костромская область | 953.56 | 1516.00 |
Тульская область | 989.33 | 2413.00 |
Владимирская область | 1092.50 | 2595.00 |
Вологодская область | 1098.59 | 3319.00 |
Орловская область | 1109.12 | 1733.00 |
Смоленская область | 1195.29 | 2330.00 |
Республика Адыгея | 1361.26 | 2284.00 |
Республика Дагестан | 1364.97 | 2630.00 |
Воронежская область | 1479.63 | 3182.00 |
Ленинградская область | 1971.00 | 4380.00 |
Архангельская область | 2168.33 | 6285.00 |
Ярославская область | 2411.03 | 5044.00 |
Республика Коми | 2629.31 | 6351.00 |
А далее заполняем таблицу 2.2. формулами: в ячейку D44 вводим: =СУММ(C4:C7). Аналогично со следующими ячейками D45 - D48; в ячейку E44: =D44/C44.
Таблица 2.2. Зависимость стоимости основных фондов от степени износа основных фондов
Номер группы | Группы областей по степени износа основных фондов в отрасли - строительство | Число областей | Стоимость основных фондов вотрасли - строительство | |
Всего | В среднем на одну область | |||
1 | 68.54-580.69 | 4 | 3407.00 | 851.75 |
2 | 580.69-1092.85 | 12 | 22386.00 | 1865.50 |
3 | 1092.85-1605.0 | 6 | 15478.00 | 2579.67 |
4 | 1605.00-2117.16 | 1 | 4380.00 | 4380.00 |
5 | 2117.16-2629.31 | 3 | 17680.00 | 5893.33 |
Итого | 26 | 63331.00 | 2435.81 |
2. Оценить тесноту связи признаков Х и Y на основе:
а) эмпирического корреляционного отношения η;
б) линейного коэффициента корреляции r.
а)для вычисления эмпирического корреляционного отношения необходимо вычислить факторную и общую дисперсию, используя функции инструмента Мастер функций: ДИСПР, СУММПРОИЗВ, КОРЕНЬ.
В ячейку А66 вводим формулу =ДИСПР(C4:C29); в ячейку В66: =СУММПРОИЗВ(D55:D59;C55:C59)/C49; в ячейку С66: =A66-B66. Теперь находим эмпирического корреляционного отношения η: в ячейку D66 вводим формулу: =КОРЕНЬ(C66/A66). В итоге получаем таблицу 2.4:
Показатели дисперсии и эмпирического корреляционного отношения
Общая дисперсия | Средняя из внутригрупповых | Факторная дисперсия | Эмпирическое корреляционное отношение |
2266566.771 | 200894.76 | 2065672.01 | 0.954654939 |
Получаем η= 0.954654939.
б) для нахождения линейного коэффициента корреляции rиспользуем инструмент Корреляция надстройки Пакет анализа.
1.Сервис => Анализ данных => Корреляция => ОК.
2.Входной интервал В4:С29;
3.Группирование – по столбцам;
4.Метки в первой строке – не активизировать;
5.Выходной интервал (А71);
6.Новый рабочий лист и Новая рабочая книга – не активизировать;
7.ОК.
В результате работы алгоритма Excel выдает оценку тесноты связи факторного и результативного признаков (табл. 2.5):
Таблица 2.5. Линейный коэффициент корреляции признаков
Столбец 1 | Столбец 2 | |
Столбец 1 | 1 | |
Столбец 2 | 0.946358973 | 1 |
Сравним значения η и r и сделаем вывод о возможности линейной связи между признаками Х и Y: так как они располагаются в диапазоне 0,9-0,99, то связь весьма тесная (по шкале Чэддока).
3. Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализ.
1. Сервис => Анализ данных => Регрессия => ОК;
2. Входной интервал YС4:С29;
3. Входной интервал XВ4:В29;
4. Метки в первой строке/Метки в первом столбце –не активизировать;
5. Уровень надежности <= 68,3;
6. Константа–ноль – не активизировать;
7. Выходной интервал А81;
8. Новый рабочий лист и Новая рабочая книга – не активизировать;
9. Остатки – активизировать;
10. Стандартизованные остатки – не активизировать;
11. Графикостатков –неактивизировать;
12. График подбора – активизировать;
13. График нормальной вероятности – не активизировать;
14. ОК.
В результате указанных действий осуществляется вывод в заданный диапазон рабочего файла четырех выходных таблиц и одного графика, начиная с ячейки, указанной в поле Выходной интервал:
Регрессионная статистика
Регрессионная статистика | |||||
Множественный R | 0.946358973 | ||||
R-квадрат | 0.895595305 | ||||
Нормированный R-квадрат | 0.891245109 | ||||
Стандартная ошибка | 506.3202843 | ||||
Наблюдения | 26 | ||||
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 1 | 52778090.51 | 52778090.51 | 205.8747195 | 2.84426E-13 |
Остаток | 24 | 6152645.527 | 256360.2303 | ||
Итого | 25 | 58930736.04 |
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | |
Y-пересечение | -32.80047442 | 198.6470804 | -0.165119338 | 0.870232989 |
Переменная X 1 | 2.292113652 | 0.159747709 | 14.34833508 | 2.84426E-13 |
Нижние95% | Верхние 95% | Нижние 68.3% | Верхние 68.3% |
-442.7878952 | 377.1869463 | -235.8061414 | 170.2051925 |
1.962410588 | 2.621816716 | 2.128860862 | 2.455366443 |
Наблюдение | Предсказанное Y | Остатки |
1 | 124.3009953 | 24.69900469 |
2 | 464.3589768 | 981.6410232 |
3 | 848.9985688 | -101.9985688 |
4 | 853.3306636 | 211.6693364 |
5 | 1512.267496 | -198.2674963 |
6 | 1573.375246 | -43.37524631 |
7 | 1647.410517 | 222.5894827 |
8 | 1704.644595 | 214.3554048 |
9 | 1796.008245 | 0.991754634 |
10 | 1833.965647 | -191.9656474 |
11 | 1884.804728 | -29.80472826 |
12 | 2028.176437 | -123.1764372 |
13 | 2047.086375 | -17.08637484 |
14 | 2152.86742 | -636.8674199 |
15 | 2234.856325 | 178.1436748 |
16 | 2471.333691 | 123.6663092 |
17 | 2485.292663 | 833.7073371 |
18 | 2509.42862 | -776.4286197 |
19 | 2706.940053 | -376.9400531 |
20 | 3087.362156 | -803.362156 |
21 | 3095.865898 | -465.8658976 |
22 | 3358.679649 | -176.679649 |
23 | 4484.955534 | -104.9555343 |
24 | 4937.258321 | 1347.741679 |
25 | 5493.554305 | -449.5543048 |
26 | 5993.876873 | 357.1231272 |