Построение корреляционной таблицы с помощью интервальной группировки по признакам y и x.
В тех случаях, когда возрастание величины факторного признака влечет за собой возрастание величины и результативного признака, говорят о возможном наличии прямой корреляционной связи. Если же с увеличением факторного признака величина результативного признака имеет тенденцию к уменьшению, то можно предполагать обратную связь между признаками.
Однако наличие большого числа различных значений результативного признака, соответствующих одному и тому же значению признака-фактора, затрудняет восприятие таких параллельных рядов особенно при большом числе единиц, составляющих изучаемую совокупность. В таких случаях целесообразнее воспользоваться для установления факта наличия связи статистическими таблицами — корреляционными или групповыми.
Для построения корелляционной таблицы необходимо разбить интервальный ряд на несколько равных интервалов и найти величину интервала. В данном случае произведем разбивку на пять интервалов. Величину интервала найдём по формулам:
где Xmax, Ymax – максимальное значение признака;
Xmin,Ymin – минимальное значение признака;
n – желательное число групп.
Интервальная группировка по X:
ix = (114-51)/5 = 12,6
Интервальная группировка по Y:
iy = (458,8-223,1)/5 = 47,14
Далее строится корреляционная таблица (таблица 2.2).
Таблица 2.2 - Корреляционная таблица
Кол-во инвентарных единиц установленного оборудования, шт. | Фонд оплаты труда, млн. руб. | Итого | ||||||||||||||||
51 | - | 64 | II | II | I | 5 | ||||||||||||
65 | - | 76 | II | 2 | ||||||||||||||
77 | - | 89 | I | I | I | I | 4 | |||||||||||
90 | - | 101 | I | I | I | 3 | ||||||||||||
102 | - | 114 | I | I | IIII | 6 | ||||||||||||
Итого | 3 | 3 | 4 | 8 | 2 |
О существовании и направлении связи можно судить по внешнему виду таблицы, т.е. по расположению в ней частот. Так, если числа (частоты) расположены (разбросаны) в клетках таблицы беспорядочно, то это чаще всего свидетельствует либо об отсутствии связи между группировочными признаками, либо об их незначительной зависимости.
Если же частоты сконцентрированы ближе к одной из диагоналей и центру таблицы, образуя своего рода эллипс, то это почти всегда свидетельствует о наличии зависимости между х и у, близкой к линейной. Расположение по диагонали из верхнего левого угла в нижний правый свидетельствует о прямой линейной зависимости между показателями x и у, а из нижнего левого угла в верхний правый — об обратной.
Проанализировав характер распределения частот в данной таблице, можно сделать вывод, что основная масса значений у расположены в первой половине таблицы – в значениях от 1244,1 млн.руб. до 1649 млн.руб.
Расчет коэффициента корреляции Фехнера
К простейшим показателям степени тесноты связи относят коэффициент Фехнера или коэффициент корреляции знаков. Он основан на сравнении поведения отклонений индивидуальных значений каждого признака (х, у) от своей средней величины. Для расчета этого показателя вычисляют средние значения результативного и факторного признаков, при этом во внимание принимаются не величины отклонений (X-
) и (Y- ), а их знаки ("+" или "—"). Определив знаки отклонения от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений и несовпадений. Если знаки всех отклонений по каждому признаку совпадут, то Кф=1. Это характеризует наличие прямой связи. Если все знаки не совпадут, то Кф = -1 (обратная связь). Если количество знаков совпадут, то Кф = 0. Итак, как и любой показатель тесноты связи, коэффициент Фехнера может принимать значения от 0 до +-1. При этом, чем ближе значение к 1, тем больше (сильнее) теснота зависимости между х и у. Однако равенство коэффициента Фехнера единице ни в коей мере нельзя воспринимать как свидетельство функциональной зависимости между х и у.Коэффициент корреляции Фехнера определяется по формуле
Kф
(2.3)где С – согласованная вариация;
Н – несогласованная вариация.
Средние значения результативного и факторного признаков рассчитываются по средней арифметической простой:
(2.4) | |
(2.5) |
Посчитав отклонения для всех значений X и Y от их средней, найдём знаки отклонений.
Если знаки отклонений для взаимосвязанных пар признаков совпадают, то вариация считается согласованной, в противном случае вариация несогласованна.
На основании полученных данных построена вспомогательная таблица по расчету коэффициента Фехнера.
Из таблицы видно, что SС=12 и SН=8.
Тогда, подставив значения, получим:
Кф=(12-8)/(12+8)=0,2
Такое значение показателя характеризует слабую зависимость между показателями.
Таблица 2.3 - Вспомогательная таблица по расчету коэффициента Фехнера
X | Y | Х-Хср | Y-Yср | Знаки отклонений от средней величины | С/Н | |
Кол-во инвентарных единиц установленного оборудования, шт. | Фонд оплаты труда, млн. руб. | X | Y | |||
114 | 371.5 | 30 | 27 | + | + | С |
106 | 389.3 | 22 | 45 | + | + | С |
52 | 228.3 | -32 | -116 | - | - | С |
95 | 447.7 | 11 | 103 | + | + | С |
51 | 248.6 | -33 | -96 | - | - | С |
89 | 458.8 | 5 | 115 | + | + | С |
69 | 399.6 | -15 | 55 | - | + | Н |
77 | 282.7 | -7 | -62 | - | - | С |
92 | 284.9 | 8 | -59 | + | - | Н |
108 | 330.5 | 24 | -14 | + | - | Н |
74 | 398.2 | -10 | 54 | - | + | Н |
53 | 330 | -31 | -14 | - | - | С |
81 | 370.4 | -3 | 26 | - | + | Н |
104 | 378.6 | 20 | 34 | + | + | С |
112 | 279 | 28 | -65 | + | - | Н |
64 | 334.9 | -20 | -9 | - | - | С |
96 | 345.6 | 12 | 1 | + | + | С |
109 | 381.8 | 25 | 38 | + | + | С |
87 | 223.1 | 3 | -121 | + | - | Н |
51 | 402.2 | -33 | 58 | - | + | Н |
Т.к. коэффициент Фехнера зависит только от знаков и не учитывает величину самих отклонений х и у от их средних величин, то практически он характеризует наличие и направление связи. Значит, рассчитав коэффициент Фехнера можно сделать вывод, что между х и у существует слабая корреляционная связь.
Расчет коэффициента корреляционных рангов
Коэффициент корреляции рангов исчисляется на основе параллельных рядов и является одним из лучших показателей тесноты связи между результативным и факторным признаком. Расчет коэффициента корреляции рангов производится по следующей формуле:
(2.6) |
где n – число размеров признака (число пар);
d – разность между рангами в двух рядах.
Ранг каждого элемента рассчитывается довольно просто, путем проставления ранга начиная с единицы, которая ставится самому наименьшему элементу среди всех элементов результативного или факторного признака. Дальнейшее проставление ранга производится по возрастанию.
Если попадаются одинаковые элементы, то ранг рассчитывается, как средняя арифметическая рангов которые должны быть по порядку среди одинаковых элементов.
Ранги каждого элемента определены ниже.
Кол-во инвентарных единиц установленного оборудования, шт. | Ранг элемента | Фонд оплаты труда, млн. руб. | Ранг элемента |
51 | 1,5 | 223.1 | 1 |
51 | 1,5 | 228.3 | 2 |
52 | 3 | 248.6 | 3 |
53 | 4 | 279 | 4 |
64 | 5 | 282.7 | 5 |
69 | 6 | 284.9 | 6 |
74 | 7 | 330 | 7 |
77 | 8 | 330.5 | 8 |
81 | 9 | 334.9 | 9 |
87 | 10 | 345.6 | 10 |
89 | 11 | 370.4 | 11 |
92 | 12 | 371.5 | 12 |
95 | 13 | 378.6 | 13 |
96 | 14 | 381.8 | 14 |
104 | 15 | 389.3 | 15 |
106 | 16 | 398.2 | 16 |
108 | 17 | 399.6 | 17 |
109 | 18 | 402.2 | 18 |
112 | 19 | 447.7 | 19 |
114 | 20 | 458.8 | 20 |
Вспомогательная таблица для расчета коэффициента корреляционных рангов приведена ниже.
Таблица 2.4 - Вспомогательная таблица для расчета коэффициента корреляционных рангов
X | Y | Ранг Х | Ранг Y | d=X-Y | d^2 |
Кол-во инвентарных единиц установленного оборудования, шт. | Фонд оплаты труда, млн. руб. | ||||
114 | 371.5 | 20 | 12 | 8 | 64 |
106 | 389.3 | 16 | 15 | 1 | 1 |
52 | 228.3 | 3 | 2 | 1 | 1 |
95 | 447.7 | 13 | 19 | -6 | 36 |
51 | 248.6 | 1,5 | 3 | -1,5 | 2,25 |
89 | 458.8 | 11 | 20 | -9 | 81 |
69 | 399.6 | 6 | 17 | -11 | 121 |
77 | 282.7 | 8 | 5 | 3 | 9 |
92 | 284.9 | 12 | 6 | 6 | 36 |
108 | 330.5 | 17 | 8 | 9 | 81 |
74 | 398.2 | 7 | 16 | -9 | 81 |
53 | 330 | 4 | 7 | -3 | 9 |
81 | 370.4 | 9 | 11 | -2 | 4 |
104 | 378.6 | 15 | 13 | 2 | 4 |
112 | 279 | 19 | 4 | 15 | 225 |
64 | 334.9 | 5 | 9 | -4 | 16 |
96 | 345.6 | 14 | 10 | 4 | 16 |
109 | 381.8 | 18 | 14 | 4 | 16 |
87 | 223.1 | 10 | 1 | 9 | 81 |
51 | 402.2 | 1,5 | 18 | -16,5 | 272,25 |
итого | 1156,5 |
n=20;р=1-6∑d
/n(n-1)=1-6*1156,5/(20*(400-1))=0,13