Переход к стандартизованным коэффициентам заключается в замене отклонений γt, εit новыми переменными, исходя из соотношений
Tγ=γt/σγt; Ti=εit/σεit ,
откуда γt=Tγσγt ; εit=Tiσεit. Подставив последние выражения в уравнение (*) и поделив левую и правую части на σγt, получим:
Tγ=(α1T1σε1t /σγt)+(α2T2σε2t /σγt)+…+(αpTpσεpt /σγt).
Переменные Т в последнем уравнении являются теперь относительными безразмерными величинами. Замена αiσεit /σγt на βi приводит уравнение к стандартизованному виду
Tγ=β1T1+ β2T2+…+ βpTp ,
в котором βi- стандартизованные коэффициенты регрессии. Они показывают, на сколько среднеквадратических отклонений изменится зависимая переменная, если величина i-го независимого фактора увеличится или уменьшится на одно свое среднеквадратическое отклонение при условии постоянства всех остальных факторов-аргументов.
Так как βi-коэффициенты являются относительными величинами, то с их помощью можно сделать вывод о степени влияния каждого фактора на функцию.
Численные значения коэффициентов определяются на основе значений коэффициентов парной корреляции.
Система нормальных уравнений, используемых при расчетах, имеет вид:
rγtε1t=β1rε1tε1t+β2rε1tε2t+…+βprε1tεptrγtε2t=β1rε2tε1t+β2rε2tε2t+…+βprε2tεpt ,
…………………………………………
rγtεpt=β1rεptε1t+β2rεptε2t+…+βprεptεpt
rγtεit=∑γεit/(∑γ2t∑ε2it)½; rεitεjt=∑εitεjt/(∑ε2it∑ε2jt)½; rεitεjt=1.
Система уравнений, линейных относительно βi, может быть решена любым способом. Естественно, оценка параметров и проверка надежности найденных уравнений регрессии осуществляются при использовании Microsoft Excel и множества статистических пакетов обработки данных, таких как SPSS, Statistica, Minitab и других. В данном случае важен содержательный алгоритм расчетов. Например, при использовании формул Крамера вi=∆i/∆, где ∆i – определитель, получаемый из главного определителя ∆ путем замены i-го столбца столбцом из свободных членов.
После решения системы и определения βi-коэффициентов находятся коэффициенты αi=βiσγt/σεit , осуществляется переход от относительных величин к абсолютным и уравнению
yt=∑pj=1ajxjt+εt, t=1,2,…n.
Для оценки параметров уравнения временные ряды должны быть не менее 15-20 лет, а прогнозный период в 2-3 раза короче. Прогнозные значения xjt можно оценить на основе экстраполяции, методом экспоненциального сглаживания, на основе трендов или уравнений авторегрессии, методом экспертных оценок. При необходимости в модели должны найти отражение периоды запаздывания.
Для определения тесноты связи рассчитывается коэффициент множественной корреляции R, 0 ≤ R ≤ 1. R не присваивается знак, т.к. факторы находятся в разной парной (прямой и обратной) зависимости с результативной переменной.
Для уравнений регрессии в стандартизованном масштабе при линейной зависимости R имеет вид:
R=(в1rгtе1t+ в2rгtе2t+…+ вprгtеpt)Ѕ.
Для определения степени влияния вариации факторных признаков на вариацию зависимого признака рассчитывается коэффициент множественной детерминации D=R2, частные коэффициенты детерминации
di=βirγtε1t ; ∑di=R2.
Для случаев нелинейной зависимости коэффициент множественной корреляции рассчитывается как результат сопоставления двух дисперсий: остаточной σ2ост и общей σ2общ.
Проверка статистической надежности уравнения множественной регрессии. В регрессионном анализе при использовании в качестве первичной информации выборочных данных результаты расчетов в значительной степени зависят от способности выборочного уравнения регрессии отображать закономерности, существующие в генеральной совокупности. Важное значение при этом имеет правильный выбор типа аналитической функции, качество подбора параметров множественного уравнения, степень разброса исходных данных относительно линии регрессии.
Для оценки статистической надежности множественных моделей могут применяться различные показатели, особое место среди них занимают t-критерий Стьюдента и F-критерий Фишера.
Для проверки существенности коэффициентов регрессии определяется расчетное значение t-критерия
,которое сопоставляется с табличным значением tтабл. Величина tтабл находится с учетом числа степеней свободы k=n-p-1, где n – количество наблюдений, p – количество факторов и доверительной вероятности P. Если tpасч > tтабл., то это свидетельствует о том, что корреляционная связь существует между признаками уt и x1t, x2t ,...,xpt не только в выборочной, но и в генеральной совокупности.
Значимость коэффициентов чистой регрессии устанавливается следующим образом. Определяется расчетная величина t-критерия для каждого i-го коэффициента, которая сравнивается с табличной.
где Аii – диагональный элемент матрицы, обратной по отношению к матрице системы нормальных уравнений. Если tрасч>tтабл, то значение i-го коэффициента пропорциональности в выборочном уравнении регрессии незначительно отличается от коэффициента регрессии, которое можно было бы построить по материалам всей совокупности. В противном случае надежность i-го коэффициента следует считать недостаточной, а соответствующий факторный признак xit рекомендуется исключить из числа переменных в уравнении регрессии.
При необходимости по известным tтабл ,σait можно рассчитать доверительную зону для выборочного коэффициента:
ав(н)it=ait±tтаблσait.
Для оценки надежности уравнения регрессии в целом рекомендуется использовать F-критерий Фишера.
.Если Fрасч>Fтабл, для k1=р-1 и k2=n-p и доверительной вероятности P, то уравнение множественной регрессии следует признать статистически значимым. В противном случае гипотеза об адекватности уравнения отбрасывается.
Также для обобщенной оценки уравнения множественной регрессии определяется средняя ошибка аппроксимации:
Допустимой ошибкой является ошибка, не превышающая 15%.
Для исключения автокорреляции непрерывный процесс изменения признака искусственно расчленяется на несколько этапов по числу отрезков времени, составляющих период наблюдения.
На каждой стадии расчетов значения переменных рассматриваются как статические величины без учета их вероятного изменения в будущем. По исходным данным, характеризующим взаимодействие признаков в каждый данный момент времени, строятся уравнения множественной регрессии
ytc=a0t+a1tx1t+a2tx2t+…+ aptxpt либо y)t=a0txa1t1txa2t2t…xaptpt.