Применение регрессионного анализа в эконометрике (стр. 1 из 5)

Московский Государственный Технический Университет

«МАМИ»

Факультет Экономический

Кафедра Информационные технологии в экономике

КУРСОВАЯ РАБОТА

По дисциплине Эконометрика

Студента Николаевой Елены Александровны

(фамилия, имя, отчество)

На тему: Применение регрессионного анализа в эконометрике

Автор работы:

Николаева Е.А. ___________________

Научный руководитель:

к. э. н., Квитченко С.А. ___________________

Дата сдачи:

«____»______________200__г.

Дата защиты:

«____»_____________200__г.

Оценка: __________________

Москва 2009

Оглавление

Введение……………………………………………………………………………...3

1. Глава 1. Теоретические и методологические основы применения регрессионного анализа в эконометрике

1.1. Основные положения регрессионного анализа………………………….5

1.2. Оценка параметров парной регрессионной модели…………………….8

1.3. Интервальная оценка функции регрессии и ее параметров…………...15

1.4. Оценка значимости уравнения регрессии и особенности

применения коэффициента детерминации………………….…………16

Выводы……………………………………………………………………………...20

2. Глава 2. Практическое применение регрессионного анализа в эконометрике

2.1. Задача 1…………………………………………………………………...22

2.2. Задача 2…………………………………………………………………...23

Выводы……………………………………………………………………………...26

Заключение………………………………………………………………………….27

Библиографический список………………………………………………………..29

Приложение

Введение

Актуальность выбранной темы определяется тем, что в эконометрике широко используются методы статистики. Во многих практических задачах прогнозирования, изучая различного рода связи в экономических, производственных системах, необходимо на основании экспериментальных данных выразить зависимую переменную в виде некоторой математической функции от независимых переменных – регрессоров, то есть построить регрессионную модель. Регрессионный анализ позволяет:

· производить расчет регрессионных моделей путем определения значений параметров – постоянных коэффициентов при независимых переменных – регрессорах, которые часто называют факторами;

· проверить гипотезу об адекватности модели имеющимся наблюдениям;

· использовать модель для прогнозирования значений зависимой переменной при новых или ненаблюдаемых значениях независимых переменных.

Целью курсовой работы явилось исследование регрессионного анализа и применение его в эконометрике. Для достижения поставленной цели были решены следующие задачи:

· изучение основных положений регрессионного анализа

· рассмотрение оценки параметров парной регрессионной модели

· изучение интервальной оценки функции регрессии и ее параметров

· исследование оценки значимости уравнения регрессии и особенностей применения коэффициента детерминации

· рассмотрение практических задач

Предметом исследования явились математико-статистические методы в экономических исследованиях.

Объект исследования курсовой работы – практическая задача по применению регрессионного анализа в эконометрике.

Информационную базу составили труды отечественных ученых-экономистов в области эконометрических исследований, публикации, Интернет источники и личные наблюдения автора.

Для написания курсовой работы использовались методы статистической обработки информации, методы аналитических процедур и возможности математических расчетов для обоснования экономических исследований.

3. Глава 1. Теоретические и методологические основы применения регрессионного анализа в эконометрике

1.1. Основные положения регрессионного анализа

Ставя цель дать количественное описание взаимосвязи между экономическими переменными, эконометрика прежде всего связана с методами регрессии и корреляции.

Регрессия [regression] — это зависимость среднего значения какой-либо случайной величины от некоторой другой величины или нескольких величин[1]. Следовательно, при регрессионной связи одному и тому же значению x величины X (в отличие от функциональной связи) могут соответствовать разные случайные значения величины Y. Распределение этих значений называется условным распределением Y при данном X = x.

Уравнение, связывающее эти величины, называется уравнением регрессии, а соответствующий график — линией регрессии величины Y по X.

К задачам регрессионного анализа относятся[2]: • установление формы зависимости между переменными; • оценка модельной функции (модельного уравнения) регрессии; • оценка неизвестных значений (прогноз значений) зависимой переменной. В регрессионном анализе рассматривается односторонняя зависимость переменной Y (ее еще называют функцией отклика, результативным признаком, предсказываемой переменной) от одной или нескольких независимых переменных X (называемых также объясняющими или предсказывающими переменными, факторными признаками).В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии.Простая регрессия представляет собой регрессию между двумя переменными y и x, то есть модель вида: y = ƒ(x), где:y – зависимая переменная (результативный признак);x – независимая, или объясняющая, переменная (признак-фактор).Множественная регрессия соответственно представляет собой регрессию результативного признака с двумя и большим числом факторов, то есть модель вида[3]:y = ƒ(x₁, x₂, …, x_k).В данной работе рассмотрена модель парной регрессии. Прежде всего из всего круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, который и используется объединяющей переменной.Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем в целом по совокупности наблюдений.В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина y складывается из двух слагаемых:y_j = ŷ_xj+ ε_j, где:y_j– фактическое значение результативного признака;ŷ_xj – теоретическое значение результативного признака, найденное исходя из соответствующей математической функции y и x, то есть из уравнения регрессии;ε_j – случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.Случайная величина ε (возмущение) включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели обусловлено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в больше мере теоретические значения результативного признака ŷ_xподходят у фактическим данным y.В парной регрессии выбор вида математической функции ŷ_x= ƒ(x) может быть осуществлен тремя методами[4]: графическим, аналитическим (исходя из теории изучаемой взаимосвязи), экспериментальным.При изучении зависимости между двумя признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на поле корреляции. Основные типы кривых, используемые при количественной оценке связей: · ŷ_x=а+b*x;· ŷ_x=а+b/x;· ŷ_x=а*x^b;· ŷ_x=а+b*x+c*x²;· ŷ_x=а+b*x+c*x²+d*x³;· ŷ_x=а*b^x.Если между экономическими явлениями существуют нелинейные соотношения[5], то они выражаются с помощью соответствующих нелинейных функций: например, равносторонней гиперболы y=a+b/x+ε, параболы второй степени y=a+b*x+c*x²+ ε и другие. Различают два класса нелинейных регрессий:· Регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам (примером такой регрессии могут служить: полиномы разных степеней – y=a+b*x+c*x²+ ε, y= a+b*x+c*x²+ d*x³+ε);· Регрессии, нелинейные по оцениваемым параметрам (к ним относятся: степенная – y=a*x^b*ε; показательная – y=a*b^x*ε; экспоненциальная – y=e^a⁺^bx*ε).1.2. Оценка параметров парной регрессионной моделиЛинейная регрессия находит широкое применение в эконометрике в виде четкой экономической интерпретации ее параметров.Линейная регрессия сводится к нахождению уравнения вида:ŷ_x=a+b*x или y=a+b*x+ε.Уравнение вида ŷ_x=a+b*x позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактические значения фактора x.Построение линейной регрессии сводится к оценке ее параметров – а и b[6]. Оценки параметров линейной регрессии могут быть найдены разными методами. Можно обратиться к полю корреляции и, выбрав на графике две точки, провести через них прямую линию. Далее по графику можно определить значения параметров. Параметр а определим как точку пересечения линии регрессии с осью oy, а параметр b оценим, исходя из угла наклона линии регрессии, как dy/dx, где dy – приращение результата у, а dx – приращение фактора х.Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК)[7].МНК позволяет получить такие оценки параметров а и b, при которых сумма квадратов отклонений фактических значений результативного признака (у) от расчетных (теоретических) ŷ_xминимальна: ∑(у_i- ŷ_xi)²→min. Иными словами, из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной.Чтобы найти минимум функции, надо вычислить частные производные по каждому из параметров а и b и приравнять их к нулю.Обозначим ∑ε_i²через S, тогда:S=∑(у_i- ŷ_xi)²=∑(y-a-b*x)²dS/da=-2∑y+2*n*a+2*b∑x=0 (1.1)dS/db=-2∑y*x+2 *a∑x +2*b∑x²=0 Преобразуя формулу (1.1), получим следующую систему нормальных уравнений для оценки параметров а и b:n*a+b∑x=∑ya ∑x+ b∑x²⁼ ∑x*y (1.2)Решая систему нормальных уравнений (1.2) либо методом последовательного исключения переменных, либо методом определителей, найдем исходные оценки параметров а и b. Можно воспользоваться следующими готовыми формулами: a=y-b*x (1.3)Формула (1.3) получена из первого уравнения системы (1.2), если все его члены разделить не n.b=cov(x,y)/σ_x², гдеcov(x,y) – ковариация признаков;σ_x²– дисперсия признака х.Ввиду того, что cov(x,y)=yx-y*x, а σ_x²=x²-x², получим следующую формулу расчета оценки параметра b:b=yx-y*x/ x²-x²Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу.Формально а – значение у при х=0. Если признак-фактор х не имеет и не может иметь нулевого значения, то вышеуказанная трактовка свободного члена а не имеет смысла. Параметр а может не иметь экономического содержания. Попытки экономически интерпретировать параметр а могут привести к абсурду, особенно при а<0.Интерпретировать можно лишь знак при параметре а. если а>0, то относительное изменение результата происходит медленнее фактора. Иными словами, вариация результата меньше вариации фактора – коэффициент вариации по фактору х выше коэффициента вариации для результата у: Vx>Vy.Нелинейная регрессия по включенным переменным не представляет никакой сложности в оценке ее параметров[8]. Она определяется, как и в линейной регрессии, МНК, обо эти функции линейны по параметрам. Так, в параболе второй степени у=а₀+а₁*х+а₂*х²+ε, заменяя переменные х=х₁, х²=х₂, получим двухфакторное уравнение линейной регрессии: у=а₀+а₁*х₁+а₂*х₂+ε, для оценки параметров которого используется МНК.Следовательно для полинома третьего порядка у=а₀+а₁*х+а₂*х²+а₃*х³+ε, при замене х=х₁,х²=х₂, х³=х₃ получим трехфакторную модель линейной регрессии: у=а₀+а₁*х₁+а₂*х₂+а₃*х₃+ε.А для полинома k-го порядка у=а₀+а₁*х+а₂*х²+…+а_k*х^k+ε получим модель множественной регрессии с k объясняющими переменными: у=а₀+а₁*х₁+а₂*х₂+…+а_k*х_k+ε/Следовательно, полином любого порядка сводится к линейной регрессии с ее методами оценивания параметров и проверки гипотез. Как показывает опыт большинства исследователей, среди нелинейной полиномиальной регрессии чаще всего используется парабола второй степени; в отдельных случаях – полином третьего порядка. Ограничения в использовании полиномов более высоких степеней связаны с требованием однородности исследуемой совокупности: чем выше порядок полинома, тем больше изгибов имеет кривая и соответственно менее однородна совокупность по результативному признаку.Парабола второй степени целесообразна к применению, если для определенного интервала значений фактора меняется характер связи рассматриваемых признаков: прямая связь меняется на обратную или обратная на прямую. В этом случае определяется значение фактора, при котором достигается максимальное (минимальное) значение результативного признака: приравнивается к нулю первая производная параболы второй степени: ŷ_x=a+b*x+c*х², то есть b+2*c*x=0 и x=-b/2*c.Если же исходные данные не обнаруживают изменения направленности связи, то параметры параболы второго порядка становятся трудно интерпретируемыми, а форма связи часто заменяется другими нелинейными моделями.Ввиду симметричности кривой парабола второй степени далеко не всегда пригодна в конкретных исследованиях. Чаще всего исследователь имеет дело лишь с отдельными сегментами параболы, а не с полной параболической формой. Кроме того, параметры параболической связи не всегда могут быть логически истолкованы. Поэтому если график зависимости не демонстрирует четко выраженной параболы второго порядка (нет смены направленности связи признаков), то она может быть заменена другой нелинейной функцией, например степенной.Среди класса нелинейных функций, параметры которых без особых затруднений оцениваются МНК, следует назвать хорошо известную в эконометрике равностороннюю гиперболу: ŷ_x=a+b/x. Она может быть использована не только для характеристики связи удельных расходов сырья, топлива, материалов с объемом выпускаемой продукции, времени обращения товаров от величины товарооборота на микроуровне, но и на макроуровне. Классическим ее примером является кривая Филипса, характеризующая нелинейное соотношение между нормой безработицы х и процентом прироста заработной платы у: y=a+b/x+ε.Для равносторонней гиперболы вида y=a+b/x+ε, заменив 1/х на z, получим линейное уравнение регрессии y=a+b*z+ε, оценка параметров которого может быть дана МНК. Система нормальных уравнений составит:∑у=n*a+b*∑1/x,∑y/x=a*∑1/x+b*∑1/x²При b>0 имеем обратную зависимость, которая при х→∞ характеризуется нижней асимптотой, то есть минимальным предельным значением у, оценкой которого служит параметр а.При b<0 имеем медленно повышающуюся функцию с верхней асимптотой при х→∞, то есть с максимальным предельным уровнем у, оценку которого в уравнении ŷ_x=a+b/x дает параметр а.Примером может служить взаимосвязь доли расходов на товары длительного пользования и общих сумм расходов (или доходов). Математическое описание подобного рода взаимосвязей получило название кривых Энгеля.Уоркинг и Лизер для описания кривой Энгеля использовали полулогарифмическую кривую у=а+b*lnx+ε/Заменив lnx на z, опять получим линейное уравнение: y=a+b*z+ε. Данная функция, как и предыдущая, линейна по параметрам и нелинейна по объясняющей переменной х. оценка параметров а и b может быть найдена МНК. Система нормальных уравнений при этом окажется следующей:∑у=n*a+b*∑lnx,∑y*lnx=a*∑lnx+b*∑(lnx)²Возможны и иные модели, нелинейные по объясняющим переменным. Например, у=а+b*√x+ε. Соответственно система нормальных уравнений для оценки параметров составит:∑у=n*a+b*∑√x,∑y*√x=a*∑√x+b*∑xУравнение с квадратными корнями использовались в исследованиях урожайности[9], трудоемкости сельскохозяйственного производства. В работе Н.Дрейнера и Г.Смита[10] справедливо отмечено, что если нет каких-либо теоретических обоснований в использовании данного вида кривых, то основная цель подобных преобразований состоит в том, чтобы для преобразованных переменных получить более простую модель регрессии, чем для исходных данных.Иначе обстоит дело с регрессией, нелинейной по оцениваемым параметрам[11]. Данный класс нелинейных моделей подразделяется на два типа: · Нелинейные модели внутренне линейные. Такая модель с помощью соответствующих преобразований может быть приведена к линейному виду;· Нелинейные модели внутренне не линейные не могут быть сведены к линейной функцииНапример, в экономических исследованиях при изучении эластичности спроса от цен широко используется степенная функция: у=а*х^b*ε, гдеу – спрашиваемое количество;х – цена;ε – случайная ошибка.Данная модель не линейна относительно оцениваемых параметров, ибо включает параметры а и b неаддитивно. Однако ее можно считать внутренне линейной, так как логарифмирование данного уравнения по основанию е приводит его к линейному виду: lny=lna+b*lnx+lnε.Соответственно оценки параметров а и b могут быть найдены МНК. В рассматриваемой степенной функции предполагается, что случайная ошибка ε мультипликативно связана с объясняющей переменной х.Если же модель представить в виде у=а*x^b+ε, то она становится внутренне не линейной, так как ее невозможно превратить в линейный вид.В специальных исследованиях по регрессионному анализу часто к нелинейным относят модели, только внутренне нелинейные по оцениваемым параметра, а все другие модели, которые внешне нелинейны, но путем преобразований параметров могут быть приведены к линейному виду, относятся к классу линейных моделей. Если модель внутренне нелинейна по параметрам, то для оценки параметров используются итеративные процедуры, успешность которых зависит от вида уравнений и особенностей применяемого итеративного подхода. Среди нелинейных функций, которые могут быть приведены к линейному виду, в эконометрических исследованиях очень широко используется степенная функция у=а*x^b*ε. Связанно это с тем, что параметр b в ней имеет четкое экономическое толкование, те есть он являеся коэффицентом эластичности. Это значит, что величина коэффициента b показывает, на сколько процентов изменился в среднем результат, если фактор изменился на 1%. О правомерности подобного истолкования параметра b для степенной функции ŷ_х=а*х^b можно судить, если рассмотреть формулу расчета коэффициента эластичностиЭ=ƒ`(x)x/y, где ƒ`(x) – первая производная, характеризующая соотношение приростов результата и фактора для соответствующей формы связи.В силу того, что коэффициент эластичности для линейной функции не является величиной постоянной, а зависит от соответствующего значения х, то обычно рассчитывается средний показатель эластичности по формуле:Э=b*x/y.Для оценки параметров степенной функции у=а*x^b*ε применяется МНК к линеаризированному уравнению lny=lna+b*lnx+lnε, то есть решается система нормальных уравнений:∑lnу=n*lna+b*∑lnx,∑lny*lnx=lna*∑lnx+b*∑(lnx)²Параметр b определяется непосредственно из системы, а параметр а – косвенным путем после потенцирования величины lna.Поскольку коэффициенты эластичности представляют экономический интерес, а виды моделей не ограничиваются только степенной функцией, то существуют формулы расчета коэффициентов эластичности для наиболее распространенных типов уравнений регрессии, приведенные в приложении 1.Несмотря на широкое использование в эконометрике коэффициентов эластичности, возможны случаи, когда их расчет экономического смысла не имеет. Это происходит тогда, когда для рассматриваемых признаков бессмысленно определение изменения значений в процентах.1.3. Интервальная оценка функции регрессии и ее параметровВ прогнозных расчетах по уравнению регрессии определяется предсказываемое (у_р) значение как точечный прогноз ŷ_xпри х_р=х_к, то есть путем подстановки в уравнение регрессии ŷ_x=a+b*x соответствующего значения х[12]. однако точечный прогноз явно не реален. Поэтому он дополняется расчетом стандартной ошибки ŷ_x, то есть m_ŷ_x, и соответственно интервальной оценкой прогнозного значения (у^*)ŷ_x-m_ŷ_x≤у^*≤ŷ_x+m_ŷ_xчто бы понять, как строится формула для определения величины стандартной ошибки ŷ_x, обратимся к уравнению линейной регрессии: ŷ_x=a+b*x. Подставим в это уравнение выражение параметра а: a=y-b*x, тогда уравнение регрессии примет вид: ŷ_x= y-b*x+b*x=у+ b(x-x).Отсюда вытекает, что стандартная ошибка m_ŷ_xзависит от ошибки у и ошибки коэффициента регрессии b, то есть:m_ŷ_x²=m_y²+m_b²(x-x)²Из теории выборки известно, что m_y²= σ²/n. Используя в качестве оценки σ² остаточную дисперсию на одну степень свободы S², получим формулу расчета ошибки среднего значения переменной у:m_y²= S²/n.Считая, что прогнозное значение фактора х_з=х_к, получим следующую формулу расчета стандартной ошибки предсказываемого по линии регрессии значения, то есть m_ŷ_x:m_ŷx²= S²/n+ S²/∑(x-x)²*(х_к-х)²= S²*(1/n+((x_k-x)²/(∑(x-x)²)))Рассмотренная формула стандартной ошибки предсказываемого среднего значения у при заданном значении x_k характеризует ошибку положения линии регрессии. Величина стандартной ошибки m_ŷ_x, как видно из формулы, достигает минимума при х_к=х, и возрастает по мере того, как «удаляется» от х в любом направлении. Иными словами, чем больше разность между х_к и х, тем больше ошибка m_ŷ_xс которой предсказывается среднее значение у для заданного значения х_к. Можно ожидать наилучшие результаты прогноза, если признак-фактор х находится в центре области наблюдений х и нельзя ожидать хороших результатов прогноза при удалении х_к от х. Если же значение х_к оказывается за пределами наблюдаемых значений х, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько х_к отклоняется от области наблюдаемых значений фактора х.Фактические значения у варьируются около среднего значения ŷ_x. Индивидуальные значения у могут отклоняться от ŷ_x на величину случайной ошибки ε, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы S². Поэтому ошибка предсказываемого индивидуального значения у должна включать не только стандартную ошибку m_ŷ_x, но и случайную ошибку S.1.4. Оценка значимости уравнения регрессии и особенности применения коэффициента детерминацииПосле того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров[13].Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза, коэффициент регрессии равен нулю, то есть b=0, и, следовательно, фактор х не оказывает влияния на результат у. Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от среднего значения у на две части – «объясненную» и «необъясненную» (приложение 2). Общая сумма квадратов отклонений индивидуальных значений результативного признака у от среднего значения у вызвана влиянием множества причин. Условно всю совокупность причин можно разделить на две группы:· изучаемый фактор х· прочие факторыЕсли фактор не оказывает влияния на результат, то линия регрессии на графике параллельна оси охи у = ŷ. Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадает с остаточной. Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов.Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс как обусловленный влиянием фактора х, то есть регрессией у по х, так и вызванный действием прочих величин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию. Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное влияние на результат у. Это равносильно тому, что коэффициент детерминации r²_xyбудет приближаться к единице.Любая сумма квадратов отклонений связана с числом степеней свободы (df – degreesoffreedom), то есть с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых отклонений из n возможных [(y₁-y), (y₂-y),…,(y_n-y)] требуется для образования данной суммы квадратов. Так, для общей суммы квадратов ∑(y-y)² требуется (n-1) независимых отклонений.При расчете объясненной или факторной суммы квадратов ∑(ŷ_x -y)² используются теоретические (расчетные) значения результативного признака ŷ_x, найденные по линии регрессии: ŷ_x=а+b*x.В линейной регрессии сумма квадратов отклонений, обусловленных линейной регрессией, составит: ∑(ŷ_x -y)²=b²*∑(x–x)². Поскольку при заданном объеме наблюдений по х и у факторная сумма квадратов при линейной регрессии зависит только от одной константы коэффициента регрессии b, то данная сумма квадратов имеет одну степень свободы. К тому же выводу придем, если рассмотрим содержательную сторону расчетного значения признака у, то есть ŷ_x. Величина ŷ_x определяется по уравнению линейной регрессии: ŷ_x=а+b*x. Параметр а можно определить как: a=y-b*x. Подставив выражение параметра а в линейную модель получим:ŷ_x= y-b*x+b*x= y-b*(х-х).Отсюда видно, что при заданном наборе переменных у и х расчетное значение ŷ_x является в линейной регрессии функцией только одного параметра – коэффициента регрессии. Соответственно и факторная сумма квадратов отклонений имеет число степеней свободы, равное 1.Существует равенство между числом степеней свободы общей, факторной и остаточной суммами квадратов. Число степеней свободы остаточной суммы квадратов при линейной регрессии составляет n-2. Число степеней свободы для общей суммы квадратов определяется числом единиц, и поскольку используется средняя вычисленная по данным выборки, то теряем одну степень свободы, то есть df_общ= n-1.Итак, имеется два равенства:∑(у-у)²=∑( ŷ_x –у)²+∑(у- ŷ_x)²,n-1=1+(n-2).Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или, что то же самое, дисперсию на одну степень свободы D.D_общ=∑(у-у)²/(n-1);D_факт=∑( ŷ_x –у)²/1;D_ост=∑(у- ŷ_x)²/(n-1).Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-отношения (F-критерия):F= D_факт/ D_ост, гдеF – критерий для проверки нулевой гипотезы Н₀: D_факт=D_ост.Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н₀ необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз.Английским статистиком Снедекором разработаны таблицы критических значений F-отношений при разных уровнях существенности нулевой гипотезы и различимом числе степеней свободы. Табличное значение F-критерия – это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: F_факт>F_табл. Н₀ отклоняется.Если же величина окажется меньше табличной F_факт<F_табл, то вероятность нулевой гипотезы выше заданного уровня и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически не значимым. Н₀ не отклоняется.

Оценку качества модели дает коэффициент детерминации. Коэффициент детерминации (R²) — это квадрат множественного коэффициента корреляции[14]. Он показывает, какая доля дисперсии результативного признака объясняется влиянием независимых переменных.