Смекни!
smekni.com

Исследование регрессионного анализа в статистическом изучении взаимосвязи показателей (стр. 4 из 6)

2.3. Проверка адекватности моделей, построенных на основе уравнений регрессии

Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.

Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объёму совокупности. Поэтому показатели регрессии и корреляции – параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.[12]

При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.

Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t-критерия.

(2.6)
Для параметра a0 :

(2.7)
для параметра a1:

(2.8)
где n - объём выборки;

- среднее квадратическое отклонение результативного признака от выравненных значений ŷ;

или
(2.9)

- среднее квадратическое отклонение факторного признака x от общей средней

.[8]

Вычисленные по вышеприведенным формулам значения сравнивают с критическими t, которые определяют по таблице Стьюдента с учетом принятого уровня значимости αи числом степеней свободы вариации

. В социально-экономических исследованиях уровень значимости α обычно принимают равным 0,05. Параметр признаётся значимым (существенным) при условии, если tрасч>tтабл. В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями.

Параметр модели признается статистически значимым, если tp>tкр

Наиболее сложным в этом выражении является определение дисперсии, которая может быть рассчитана двояким способом.

Наиболее сложным этапом, завершающим регрессионный анализ, является интерпретация уравнения, т.е. перевод его с языка статистики и математики на язык экономиста.

Интерпретация моделей регрессии осуществляется методами той отрасли знаний, к которой относятся исследуемые явления. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки значимости входящих в модель факторных признаков, т.е. с выяснения, как они влияют на величину результативного признака. Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак плюс, то с увеличением данного фактора результативный признак возрастает; если факторный признак со знаком минус, то с его увеличением результативный признак уменьшается.[12]

Интерпретация этих знаков полностью определяется социально-экономическим содержанием моделируемого (результативного) признака. Если его величина изменяется в сторону увеличения, то плюсовые знаки факторных признаков имеют положительное влияние. При изменении результативного призна-л-1 в сторону снижения положительное значение имеют минусовые знаки факторных признаков. Если экономическая теория подсказывает, что факторный признак должен иметь положительное значение, а он со знаком минус, то необходимо проверить расчеты параметров уравнения регрессии. Такое явление чаще всего бывает в силу допущенных ошибок при решении. Однако следует иметь в виду, что при анализе совокупного влияния факторов, при наличии взаимосвязей между ними характер их влияния может меняться. Для того чтобы быть уверенным, что факторный признак изменил знак влияния, необходима тщательная проверка решения данной модели, так как часто знаки могут меняться в силу допустимых ошибок при сборе или обработке информации.[4]

При адекватности уравнения регрессии исследуемому процессу возможны следующие варианты.

1. Построенная модель на основе ее проверки по F-критерию Фишера в целом адекватна, и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений к осуществлению прогнозов.

2. Модель по F-критерию Фишера адекватна, но часть коэффициентов регрессии незначима. В этом случае модель пригодна для принятия некоторых решений, но не для производства прогнозов.

3. Модель по F-критерию Фишера адекватна, но все коэффициенты регрессии незначимы. Поэтому модель полностью считается неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.[12]

3. ПРИМЕНЕНИЕ РЕГРЕССИОННОГО АНАЛИЗА ДЛЯ ИЗУЧЕНИЯ ОБЪЕКТА ИССЛЕДОВАНИЯ

Таблица 3.1.

Исходные данные[15]

№ предприятия Объем добычи, тыс. т Численность рабочих, чел Стоимость основных фондов, тыс. у.е. Фондоотдача, тыс. т/ Производительность труда
1 1275 240 10450 0,12 5,31
2 1250 210 7458 0,17 5,95
3 1054 264 9845 0,11 4
4 1513 240 8580 0,18 6,3
5 2214 276 9900 0,22 8,02
6 950 234 9790 0,1 4,06
7 1890 246 9350 0,2 7,68
8 2380 250 12650 0,19 9,52
9 2065 300 11290,4 0,18 6,88
10 1785 276 13200 0,14 6,47
11 1420 290 11200 0,13 4,9
12 1720 310 1460 1,18 5,55

Выделим основные показатели деятельности предприятия такие как: объем добычи, стоимость ОПФ и производительность труда рабочих.

Для начала необходимо найти недостающие данные. Проведём расчет производительности труда по формуле 3.1:

, (3.1)

где

- выпуск валовой продукции;

- средняя списочная численность.

Результаты расчетов поместим в таблицу 3.2.

Таблица 3.2

Производительность труда, млн. руб./чел.

Пред-ие 1 2 3 4 5 6 7 8 9 10 11 12

Производ-ность

труда

5,31 5,95 4 6,3 8,02 4,06 7,68 9,52 6,88 6,47 4,9 5,55

Для установления зависимости объёма добычи от стоимости ОПФ и производительности труда рабочих проведём корреляционно-регрессионный анализ.

Чтобы провести анализ, присвоим переменным C, X, Y значения показателей величин: стоимости ОПФ, производительность труда рабочих и объёма добычи соответственно.

Прежде всего найдём средние значения показателей объёма добычи, стоимости основных фондов и производительности труда (X, Y, Z) по формуле средней арифметической 3.2:

, (3.2)

где xi–значение показателя i-го предприятия;

n- количество предприятий.

Результат представим в виде таблицы 3.3

Таблица 3.3

Средние значения показателей

Y

(oбъем добычи), тыс. т.

X

(стоимость основных фондов), млн.руб.

Z (производительность труда), тыс. т./чел.
Cреднее значение показателей 1626,33 9597,78 6,22

Далее проведём ряд расчётов и для удобства их проведения поместим результаты промежуточных расчетов в таблицу 3.4.

Таблица 3.4

Результаты расчетов

Предприятие Xi-X (Xi-X)2 Yi-Y (Yi-Y)2 Zi-Z (Zi-Z)2
1 852,22 726273,25 -351,33 123435,11 -0,91 0,83
2 7458,00 55621764,00 1250,00 1562500,00 5,95 35,40
3 9845,00 96924025,00 1054,00 1110916,00 4,00 16,00
4 8580,00 73616400,00 1513,00 2289169,00 6,30 39,69
5 9900,00 98010000,00 2214,00 4901796,00 8,02 64,32
6 9790,00 95844100,00 950,00 902500,00 4,06 16,48
7 9350,00 87422500,00 1890,00 3572100,00 7,68 58,98
8 12650,00 160022500,00 2380,00 5664400,00 9,52 90,63
9 11290,40 127473132,16 2065,00 4264225,00 6,88 47,33
10 13200,00 174240000,00 1785,00 3186225,00 6,47 41,86
11 11200,00 125440000,00 1420,00 2016400,00 4,90 24,01
12 1460,00 2131600,00 1720,00 2958400,00 5,55 30,80
Сумма 1097472294,41 32552066,11 466,35

Найдём среднее квадратическое отклонение каждого показателя по формуле 3.3: