Однако наличие большого числа различных значений результативного признака, соответствующих одному и тому же значению признака-фактора, затрудняет восприятие таких параллельных рядов особенно при большом числе единиц, составляющих изучаемую совокупность. В таких случаях целесообразнее воспользоваться для установления факта наличия связи статистическими таблицами — корреляционными или групповыми.
Для построения корелляционной таблицы необходимо разбить интервальный ряд на несколько равных интервалов и найти величину интервала.
В нашем случае произведем разбивку на четыре интервала. Величину интервала найдём по формуле:где Xmax и Xmin - максимальное и минимальное значение признака соответственно, а n – число интервалов.
Интервальная группировка по X:
ix=(Xmax-Xmin)/n=(973-507)/4=116,5
поY(аналогично):
iy=(Ymax-Ymin)/n=(1401,2-541,2)/4=215
Найдя величины интервалов можно построить таблицу, которая в нашем случае будет иметь следующий вид:
Таблица 2. Зависимость между среднесписочной численностью промышленно-производственного персонала и среднегодовой стоимостью промышленно-производственных фондов
YX | 507-623,5 | 623,5-740 | 740-856,5 | 856,5-973 | Итого |
541,2-756,2 | || | | | 3 | ||
756,2-971,2 | || | | | 3 | ||
971,2-1186,2 | || | || | || | || | 8 |
1186,2-1401,2 | | | | | |||| | 6 | |
Итого | 4 | 5 | 3 | 8 | 20 |
О существовании и направлении связи можно судить по внешнему виду таблицы, т.е. по расположению в ней частот. Так, если числа (частоты) расположены (разбросаны) в клетках таблицы беспорядочно, то это чаще всего свидетельствует либо об отсутствии связи между группировочными признаками, либо об их незначительной зависимости.
Если же частоты сконцентрированы ближе к одной из диагоналей и центру таблицы, образуя своего рода эллипс, то это почти всегда свидетельствует о наличии зависимости между х и у, близкой к линейной. Расположение по диагонали из верхнего левого угла в нижний правый свидетельствует о прямой линейной зависимости между показателями x и у, а из нижнего левого угла в верхний правый — об обратной.
Проанализировав характер распределения частот в данной таблице, можно сделать вывод, что между показателями х и у существует связь - прямая линейная зависимость, т.е. увеличение значений результативного признака с увеличением значения факторного признака. Вид корреляционной таблицы свидетельствуют о наличии прямой зависимости между валовой продукцией и средним возрастом установленного оборудования.
1. Расчет коэффициента корреляции Фехнера
К простейшим показателям степени тесноты связи относят коэффициент Фехнера или коэффициент корреляции знаков. Он основан на сравнении поведения отклонений индивидуальных значений каждого признака (х, у) от своей средней величины. Для расчета этого показателя вычисляют средние значения результативного и факторного признаков, при этом во внимание принимаются не величины отклонений (X- ) и(Y- ), а ихзнаки («+» или «—»). Определив знаки отклонения от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений и несовпадений. Если знаки всех отклонений по каждому признаку совпадут, то Кф=1. Это характеризует наличие прямой связи. Если все знаки не совпадут, то Кф =— 1 (обратная связь). Если количество знаков совпадут, то Кф = 0. Итак, как и любой показатель тесноты связи, коэффициент Фехнера может принимать значения от 0 до
1. При этом чем ближе значение к 1, тем больше (сильнее) теснота зависимости между х и у. Однако равенство коэффициента Фехнера единице ни в коей мере нельзя воспринимать как свидетельство функциональной зависимости между х и у.Средние значения результативного и факторного признаков рассчитываются по средней арифметической простой:
=15462/20=773,1 =20326,6/20=1016,33Посчитав отклонения для всех значений X и Y от их средней, найдём знаки отклонений. Если знаки отклонений для взаимосвязанных пар признаков совпадают, то вариация считается согласованной, в противном случае вариация несогласованна.
На основании полученных данных построена следующая таблица:
Таблица 3.
Среднесписочная численность промышленно-производственного персонала (рабочих), чел. (X) | Среднегодовая стоимость промышленно-производственных фондов, млн. руб. (Y) | (X- ) | (Y- ) | Знаки отклонений от средней величины | с/н | ||
X | Y | ||||||
852 | 1361,2 | 78,9 | 344,87 | + | + | с | |
883 | 1401,2 | 109,9 | 384,87 | + | + | с | |
511 | 541,2 | -262,1 | -475,13 | - | - | с | |
973 | 1189,2 | 199,9 | 172,87 | + | + | с | |
507 | 542,8 | -266,1 | -473,53 | - | - | с | |
926 | 1201,6 | 152,9 | 185,27 | + | + | с | |
705 | 785,2 | -68,1 | -231,13 | - | - | с | |
536 | 1072,4 | -237,1 | 56,07 | - | + | н | |
642 | 1157,6 | -131,1 | 141,27 | - | + | н | |
724 | 1207,2 | -49,1 | 190,87 | - | + | н | |
964 | 998,8 | 190,9 | -17,53 | + | - | н | |
881 | 775,8 | 107,9 | -240,53 | + | - | н | |
832 | 982,4 | 58,9 | -33,93 | + | - | н | |
954 | 1135,2 | 180,9 | 118,87 | + | + | с | |
641 | 1158,4 | -132,1 | 142,07 | - | + | н | |
731 | 821,6 | -42,1 | -194,73 | - | - | с | |
850 | 1097,6 | 76,9 | 81,27 | + | + | с | |
943 | 1151,2 | 169,9 | 134,87 | + | + | с | |
512 | 1105,6 | -261,1 | 89,27 | - | + | н | |
896 | 640,4 | 122,9 | -375,93 | + | - | н |
Коэффициент Фехнера рассчитывается по формуле:
,
где SС и SН – соответственно количество согласованных и несогласованных вариаций. Из таблицы видно, что SС=11 и SН=9.
Тогда, подставив значения, получим:
Кф=(11-9)/(11+9)=0,1
Такое значение показателя характеризует очень слабую зависимость между показателями.
Т.к. коэффициент Фехнера зависит только от знаков и не учитывает величину самих отклонений х и у от их средних величин, то практически он характеризует наличие и направление связи. Значит, рассчитав коэффициент Фехнера можно сделать вывод, что между х и у существует прямая корреляционная связь.
2. Расчет коэффициента корреляционных рангов
Коэффициент корреляции рангов исчисляется на основе параллельных рядов и является одним из лучших показателей тесноты связи между результативным и факторным признаком. Расчет коэффициента корреляции рангов производится по следующей формуле:где d-разность между рангами в двух рядах;
n-число наблюдаемых пар значений х и у.
Ранг каждого элемента рассчитывается довольно просто, путем проставления ранга начиная с единицы, которая ставится самому наименьшему элементу среди всех элементов результативного или факторного признака. Дальнейшее проставление ранга производится по возрастанию. Если попадаются одинаковые элементы, то ранг рассчитывается, как средняя арифметическая рангов которые должны быть по порядку среди одинаковых элементов.
Тогда ранги в данном случае имеют вид:
Таблица 4.
Среднесписочная численность промышленно-производственного персонала (рабочих), чел. (X) | Среднегодовая стоимость промышленно-производственных фондов, млн. руб. (Y) | Ранг X | Ранг Y | d=X-Y | d^2 |
507 | 542,8 | 1 | 2 | -1 | 1 |
511 | 541,2 | 2 | 1 | 1 | 1 |
512 | 1105,6 | 3 | 11 | -8 | 64 |
536 | 1072,4 | 4 | 9 | -5 | 25 |
641 | 1158,4 | 5 | 15 | -10 | 100 |
642 | 1157,6 | 6 | 14 | -8 | 64 |
705 | 785,2 | 7 | 5 | 2 | 4 |
724 | 1207,2 | 8 | 18 | -10 | 100 |
731 | 821,6 | 9 | 6 | 3 | 9 |
832 | 982,4 | 10 | 7 | 3 | 9 |
850 | 1097,6 | 11 | 10 | 1 | 1 |
852 | 1361,2 | 12 | 19 | -7 | 49 |
881 | 775,8 | 13 | 4 | 9 | 81 |
883 | 1401,2 | 14 | 20 | -6 | 36 |
896 | 640,4 | 15 | 3 | 12 | 144 |
926 | 1201,6 | 16 | 17 | -1 | 1 |
943 | 1151,2 | 17 | 13 | 4 | 16 |
954 | 1135,2 | 18 | 12 | 6 | 36 |
964 | 998,8 | 19 | 8 | 11 | 121 |
973 | 1189,2 | 20 | 16 | 4 | 16 |
Итого: | 878 |
n=20