Смекни!
smekni.com

Статистическое исследование взаимосвязи социально-экономических показателей (стр. 4 из 8)

где σxi – среднее квадратическое отклонение факторного признака,

σy – среднее квадратическое отклонение результативного признака,

ai – коэффициент регрессии при соответствующем факторном признаке xi.

При интерпретации результатов корреляционно-регрессионного анализа часто используют частные коэффициенты эластичности (Exi). Коэффициент эластичности (1.1.14) показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного на 1% и при постоянстве (фиксированном уровне) других факторов:

(1.1.14)

где

– среднее значение факторного признака,

– среднее значение результативного признака.

Множественная корреляция характеризует тесноту и направленность связи между результативным и несколькими факторными признаками. Основой измерения связей является матрица парных коэффициентов корреляции. По ней можно в первом приближении судить о тесноте связи факторных признаков между собой и с результативным признаком, а также осуществлять предварительный отбор факторов для включения их в уравнение регрессии. При этом не следует включать в модель факторы, слабо коррелирующие с результативным признаком и тесно связанные между собой. Не допускается включать в модель функционально связанные между собой факторные признаки, так как это приводит к неопределенности решения.

Более точную характеристику тесноты зависимости дают частные коэффициенты корреляции. Их удобно анализировать, если они представлены в табличном виде. Частный коэффициент корреляции служит показателем линейной связи между двумя признаками, исключая влияние всех остальных представленных в модели факторов. Например, для двухфакторной модели частный коэффициент корреляции между y и x1 при фиксированном x2 (ryx1/x2) определяется в соответствии с (1.1.15).

(1.1.15)

где ryx1, ryx2, rx1x2 – парные коэффициенты корреляции.

Проверка значимости частных коэффициентов корреляции аналогична, как и для парных коэффициентов корреляции.

Множественный коэффициент корреляции (R) рассчитывается при наличии линейной связи между всеми признаками регрессионной модели. R изменяется в пределах от 0 до 1. Значимость множественного коэффициента корреляции проверяется на основе F-критерия Фишера. Например, в двухфакторной модели при оценке связи между результативным и факторными признаками для определения множественного коэффициента корреляции можно использовать формулу (1.1.16):

или (1.1.16)

где δ2y x1x2 – дисперсия результативного признака, рассчитанная по регрессионному уравнению,

σ2y – общая дисперсия результативного признака,

ryx1, ryx2, rx1x2 – парные коэффициенты корреляции.

Квадрат множественного коэффициента корреляции называют множественным коэффициентом детерминации (R2). R2 оценивает долю вариации результативного фактора за счет представленных в модели факторов в общей вариации результата. Множественный коэффициент детерминации обычно корректируют на потерю степеней свободы вариации по формуле (1.1.17):

(1.1.17)

где R2корр – корректированный множественный коэффициент детерминации,

R2 –множественный коэффициент детерминации,

n – объем совокупности,

m – количество факторных признаков.

Статистическая надежность регрессионного уравнения в целом оценивается на основе F-критерия Фишера: проверяется нулевая гипотеза о несоответствии представленных регрессионным уравнением связей реально существующим (H0: a0= a1=a2=…=am=0, R=0). Для проверки H0 следует рассчитать значение F-критерия (Fр) и сравнить его с табличным значением (Fт), определяемым с использованием таблицы приложения 1 по заданным уровню значимости (α= 0,05) и числу степеней свободы (d.f.1=m-1 и d.f.2=n-m). Fр определяется из соотношения факторной и остаточной дисперсий, рассчитанных на одну степень свободы по формуле (1.1.18):

(1.1.18)

где Dфакт, Dост – суммы квадратов отклонений, характеризующие факторную и остаточную вариации результативного признака. В случае однофакторного дисперсионного комплекса Dфакт и Dост выражаются в соответствии с (1.1.19),

d.f.1 = m-1 – число степеней свободы факторной дисперсии,

d.f.2 = n-m – число степеней свободы остаточной дисперсии.

(1.1.19)

где yij, – значения результативного признака у i–й единицы в j–й группе,

i – номер единицы совокупности,

j – номер группы,

nj – численность j–й группы,

– средняя величина результативного признака в j–й группе,

– общая средняя результативного признака.

Если Fр > Fт, то гипотеза H0 отвергается. При этом с вероятностью 1-α= 0,95, или 95%, принимается альтернативная гипотеза о неслучайной природе оцениваемых характеристик, т.е. признается статистическая значимость регрессионного уравнения и его параметров.

1.6. Проверка адекватности регрессионной модели

Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.

Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объёму совокупности. Поэтому показатели регрессии и корреляции – параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.

Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t-критерия

для параметра a0 :


(1.1.20)

для параметра a1 :

(1.1.21)

где n - объём выборки;


(1.1.22)

- среднее квадратическое отклонение результативного признака от выравненных значений ŷ ;

или
(1.1.23)

- среднее квадратическое отклонение факторного признака x от общей средней

.

Вычисленные по вышеприведенным формулам значения сравнивают с критическими t, которые определяют по таблице Стьюдента с учетом принятого уровня значимости α и числом степеней свободы вариации

. В социально-экономических исследованиях уровень значимости α обычно принимают равным 0,05. Параметр признаётся значимым (существенным) при условии, если tрасч>tтабл. В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями.

Проверка адекватности регрессионной модели может быть дополнена корреляционным анализом. Для этого необходимо определить теснотукорреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционным отношениемηэ , когда δ2 (межгрупповая дисперсия) характеризует отклонения групповых средних результативного признака от общей средней:

.

Говоря о корреляционном отношении как о показателе измерения тесноты зависимости, следует отличать от эмпирического корреляционного отношения – теоретическое.

Теоретическое корреляционное отношение η представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выравненных значений результативного признака δ, то есть рассчитанных по уравнению регрессии, со средним квадратическим отношением эмпирических (фактических) значений результативности признака σ: