2. Метод аналитических группировок (см. пункт 1.2).
3. Графический метод. При построении графика по оси абсцисс отражаются значения факторного признак, а по оси ординат – результативного. Полученная совокупность называется полем корреляции и позволяет визуально оценить наличие связи, ее вид и интенсивность.
4. Корреляционный анализ, задачи которого сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.
5. Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой, или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Но целесообразнее применять корреляционный и регрессионный анализы в совокупности.
Корреляционная связь может возникать в различных формах:
1. Парная корреляция — связь между двумя признаками (результативным и факторным).
2. Частная корреляция — зависимость между результативным и одним из факторных признаков при фиксированном значении других факторных признаков.
3. Однофакторная корреляция – зависимость между результативным признаком и одним факторным.
4. Многофакторная корреляция — зависимость результативного и двух или более факторных признаков, включенных в исследование.
Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). Теснота связи количественно выражается величиной коэффициентов корреляции.
Величина коэффициента корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.
Регрессия может быть однофакторной (парной) и многофакторной (множественной).
Уравнение линейной множественной регрессии имеет вид:
(14)
где
— расчетные значения результативного признака;х1, х2,, , хn— факторные признаки;
— параметры модели (коэффициенты регрессии). Для нахождения параметров линейной множественной регрессии необходимо решить систему уравнений: (15)
Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.
Корреляционно-регрессионный анализ проводится для ограниченных по объему совокупностей, поэтому показатели регрессии и корреляции могут быть искажены влиянием случайных факторов. Общая оценка адекватности уравнения может быть получена с помощью дисперсионного F-критерия Фишера:
(16)
где m- число параметров в уравнении регрессии.
Принято считать, что уравнение регрессии пригодно для практического использования, если
> не менее чем в 4 раза.Показателем тесноты связи, устанавливаемой между результативными и двумя и более факторными признаками, является совокупный коэффициент множественной корреляции
.В случае оценки связи между результативным (у) и двумя факторными признаками (x1) и (х2) множественный коэффициент корреляции можно определить по формуле [2]:
(17)
где r - линейные коэффициенты корреляции (парные); подстрочные индексы показывают, между какими признаками они исчисляются.
Совокупный коэффициент множественной корреляции измеряет одновременное влияние факторных признаков на результативный. Его значение находятся в пределах от –1 до +1. Чем меньше наблюдаемые значения изучаемого показателя отклоняются от линии множественной регрессии, тем корреляционная связь является более интенсивной, а, следовательно, значение R ближе к единице.
Чтобы узнать, какая доля вариации изучаемого признака объясняется влиянием факторов, включенных в уравнение множественной регрессии, необходимо воспользоваться совокупным коэффициентом множественной детерминации (R2). Его значение находятся в пределах 0 до +1. Чем ближе R2к +1, тем большая доля вариации изучаемого признака объясняется влиянием отобранных факторов.
ГЛАВА 2. ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ ДЛЯ АНАЛИЗА КАДРОВОГО ПОТЕНЦИАЛА НАУКИ РФ ПО ОБЛАСТЯМ
2.1. АНАЛИЗ ОДНОРОДНОСТИ СОВОКУПНОСТИ
Для проведения анализа используются средние величины, т.е. обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени. Однако, для того, чтобы средний показатель был действительно типизирующим, он должен определяться только для совокупностей, состоящих из качественно однородных единиц. Поэтому первым этапом анализа будет определение, является ли данная совокупность однородной.
Сначала построим на основе данных (Приложение 1 таблица 1) ранжированный ряд по выбранному факторному признаку, которым является затраты на технологические инновации.
Результаты построения приведены в таблице 2.
Таблица 2 - Ранжированный ряд распределения областей РФ по сумме затрат на технологические инновации
№ | Затраты на технологические инновации, млн. руб. | № | Затраты на технологические инновации, млн. руб. | № | Затраты на технологические инновации, млн. руб. |
1 | 171,0 | 11 | 1154,8 | 21 | 3844,6 |
2 | 273,2 | 12 | 1191,9 | 22 | 4070,1 |
3 | 371,5 | 13 | 1197,8 | 23 | 4674,6 |
4 | 415,7 | 14 | 1360,3 | 24 | 5752,9 |
5 | 564,0 | 15 | 1482,9 | 25 | 6408,9 |
6 | 737,0 | 16 | 1983,4 | 26 | 7923,1 |
7 | 799,3 | 17 | 2123,7 | 27 | 8042,0 |
8 | 939,0 | 18 | 3204,0 | 28 | 11377,0 |
9 | 972,9 | 19 | 3386,5 | 29 | 25644,0 |
10 | 1127,4 | 20 | 3417,2 | 30 | 41032,8 |
Затем определяем:
1) размах вариации по формуле 1: R = 41032,8 -171,0 = 40861,8 млн. руб.
2) с помощью формулы 2 число групп: n = 1+3,322lg30 = 6 групп
3) величину интервала по формуле 3: i =
= 6810,3 млн. руб.Отсюда, путем прибавления величины интервала к минимальному уровню признака в группе получим следующие группы областей по сумме затрат на технологические инновации (таблица 3).
Таблица 3 - Интервальный ряд распределения областей РФ по сумме затрат на технологические инновации
№ гр. | Группы областей | Число областей | Середина интервала |
1 | 171,0-6981,3 | 25 | 3576,2 |
2 | 6981,3-13791,6 | 3 | 10386,5 |
3 | 13791,6-20601,9 | 0 | 17196,8 |
4 | 20601,9-27412,2 | 1 | 24007,1 |
5 | 27412,2-34222,5 | 0 | 30817,4 |
6 | 34222,5-41032,8 | 1 | 37627,7 |
ИТОГО | 30 | - |
Из интервального ряда видно, что 25 областей из 30 имеют минимальную сумму затрат на технологические инновации в интервале от 171,0 млн. руб. до 6981,3 млн. руб. И только 1 область имеет наибольшую сумму затрат от 34222,5 млн. руб. до 41032,8 млн. руб.
На основании построенного ранжированного ряда строится диаграмма Огива Гальтона (ПРИЛОЖЕНИЕ 2 рис.1).Интервальный ряд отражается в виде гистограммы (ПРИЛОЖЕНИЕ 2 рис.2).
Для определения однородности совокупности на основании интервального ряда рассчитаем среднюю арифметическую взвешенную, показатели вариации, моду, медиану.
Для расчета вышеуказанных показателей оформим таблицу 4.
Таблица 4 – Расчётные данные
№ группы | Гр. областей по сумме затрат на технологические инновации | Число областей | Середина интервала | xifi | /xi-xвзв/ | /xi-xвзв/fi | (xi-xвзв)2fi |
1 | 171,0-6981,3 | 25 | 3576,2 | 89403,8 | 2497,1 | 62427,8 | 155888958,8 |
2 | 6981,3-13791,6 | 3 | 10386,5 | 31159,4 | 4313,2 | 12939,6 | 55810823,9 |
3 | 13791,6-20601,9 | 0 | 17196,8 | 0,0 | 11123,5 | 0,0 | 0,0 |
4 | 20601,9-27412,2 | 1 | 24007,1 | 24007,1 | 17933,8 | 17933,8 | 321620823,8 |
5 | 27412,2-34222,5 | 0 | 30817,4 | 0,0 | 24744,1 | 0,0 | 0,0 |
6 | 34222,5-41032,8 | 1 | 37627,7 | 37627,7 | 31554,4 | 31554,4 | 995679528,3 |
ВСЕГО | 30 | - | 182197,8 | - | 124855,5 | 1529000134,8 |
Используя данные таблицы, рассчитаем:
1) Среднюю арифметическую взвешенную по формуле 11:
= 6073,3 млн. руб.2) Моду по формуле 12: интервал 171,0 - 6981,3 является модальным, т.к. характеризуется максимальной частотой (25), отсюда
Мо = 171,0+6810,3
((25-0)/((25-0)+(25-1))) = 3645,6 млн. руб.3) Медиану по формуле 13: т.к. Sm>полусуммы частот (25>15), то интервал у первой группы (171,0 - 6981,3) будет являться медианным, следовательно:
Ме = 171,0+6810,3
((15-0)/25) = 4257,2 млн. руб.