Тесноту связи изучаемых явлений оценивает линейныйкоэффициент парной корреляции
для линейной регрессии: где n – объём выборки; - выборочные средние.Для оценки статистической значимости коэффициента регрессииb, постоянной а и коэффициента корреляции
рассчитываются фактические значения t - критерия Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости показателей с помощью t - критерия Стьюдента проводится путём сопоставления значения показателей с величиной их стандартных ошибок, т.е. определяются фактические значения t - критерия Стьюдента:Стандартные ошибки коэффициента регрессии, константы и коэффициента корреляции рассчитываются по формулам:
,где
, m – число параметров при независимой переменной x. Величина S называется стандартной ошибкой регрессии и служит мерой разброса зависимой переменной (результата) вокруг линии регрессии.Сравнивая фактическое значение t – статистики с критическим (табличным) значением при определенном уровне значимости (обычно
=0,05) и числе степеней свободы (n-2), делаем соответствующие выводы.Если
, то отклоняется, т.е. и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x.Если
, то принимается и признается случайная природа формирования или .Для парной линейной регрессии связь между F – критерием Фишера иt - критерием Стьюдента выражается равенством:
.Для расчёта доверительного интервала определяем предельную ошибку для каждого показателя:
.Формулы для расчёта доверительных интервалов имеют вид:
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается равным нулю, так как он не может одновременно принимать и положительное и отрицательное значения.
Прогнозное значение
определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения . Вычисляется стандартная ошибка прогноза: .Доверительный интервал для действительного значения
определяется выражением: ,где
- критическое значение t – статистики при заданном уровне значимости (обычно =0,05) и числе степеней свободы (n-2), n - объём выборки (число наблюдаемых значений).