Поскольку мы ошиблись в выборе класса функции регрессии, что, к сожалению, достаточно часто встречается в практике статистических исследований, то наши статистические выводы и оценки не будут обладать свойством состоятельности, т.е., как бы
мы не увеличивали объем наблюдений, наша выборочная оценка
не будет сходиться к истинной функции регрессии f(х).Если бы мы правильно выбрали класс функций регрессии, то неточность в описании f(x) с помощью
объяснялась бы только ограниченностью выборки и, следовательно, она могла бы быть сделана сколько угодно малой при n .С целью наилучшего восстановления по исходным статистическим данным условного значения результатирующего показателя у(х) и неизвестной функции регрессии f(x) = M(y/x) наиболее часто используют следующие критерии адекватности (функции потерь).
1. Метод наименьших квадратов, согласно которому минимизируется квадрат отклонения наблюдаемых значений результативного показателя yi(i=1,2,…,n) от модельных значений
i = f(xi, b), где b = (b0, b1,…,bk) - коэффициенты уравнения регрессии, xi– значение вектора аргументов в i-м наблюдении: .Решается задача отыскания оценки
вектора b. Получаемая регрессия называется среднеквадратической.2. Метод наименьших модулей, согласно которому минимизируется сумма абсолютных отклонений наблюдаемых значений результативного показателя от модульных значений
= f(xi, b), т.е. .Получаемая регрессия называется среднеабсолютной (медианой).
3. Метод минимакса сводится к минимизации максимума модуля отклонения наблюдаемого значения результативного показателя yi от модельного значения f(xi, b), т.е.
.Получаемая при этом регрессия называется минимаксной.
В практических положениях часто встречаются задачи, в которых изучается случайная величина у, зависящая от некоторого множества переменных x1, x2,…,хk и неизвестных параметров bj(j=0,1,2,…,k). Будем рассматривать (у, x1, x2,…,хk ) как
(k +1) – мерную генеральную совокупность, из которой взята случайная выборка объемов n, где (уi,xi1,xi2,…,xik)результат i-го наблюдения i=1,2,…,n. Требуется по результатам наблюдений оценить неизвестные параметры bj(j=0,1,2,…,k).
Описанная выше задача относится к задачам регрессионного анализа.
Регрессионным анализом называется метод статистического анализа зависимости случайной величины у от переменных xj(j=1,2,…,k), рассматриваемых в регрессионном анализе как неслучайные величины, независимо от истинного закона распределения xj.
Обычно предполагается, что случайная величина у имеет нормальный закон распределения с условным математическим ожиданием
, являющимся функцией от аргументов xj(j=1,2,…,k)и постоянной, не зависящей от аргументов дисперсий , т.е. следует помнить, что требование нормальности закона распределения необходимо лишь для проверки значимости уравнения регрессии и его параметров bj, а также для интервального оценивания регрессии и его параметров bj. Для получения точечных оценок bj(j=0,1,2,…,k)этого условия не требуется.В общем виде линейная модель регрессионного анализа имеет вид:
у = ,
где jj – некоторая функция его переменных x1, x2,…,хk ;
e - случайная величина с нулевым математическим ожиданием и дисперсией s
Примечание.
В регрессионном анализе под линейной моделью подразумевает модель, линейно зависящую о неизвестных параметров bj.
Собственно линейной будем называть модель, линейно зависящую как от параметров bj, так иот переменных хj.
В регрессионном методе вид уравнения регрессии выбирают исходя из анализа физической сущности изучаемого явления и результатов наблюдения.
Наиболее часто встречаются следующие виды уравнений регрессии:
· собственно линейное многомерное
= ;· полиномиальное
= ;· гиперболическое
= ;· степенное
= .Путем логарифмирования степенные уравнения регрессии могут быть преобразованы в линейные уравнения относительно параметров bj.
Логарифмируя, получим:
.Пусть lgxj = uj для j=1,2,…,k;
и , тогда после подстановки будем иметь собственно линейные уравнения регрессии: = .Путем подстановок
и гиперболическое и полиномиальное уравнения могут быть преобразованы в собственно линейные, теория которых разработана наиболее полно.Оценки неизвестных параметров уравнения регрессии находят обычно методом наименьших квадратов и свойствах оценок, найденных этим методом.
Регрессионный анализ рынка труда.
В общем виде задача статистики в области изучения взаимосвязей состоит не только в количественной оценке их наличия, направления и силы связи, но и в определении формы (аналитического выражения) влияния факторных признаков на результативный. Для ее решения применяют метод регрессионного анализа.
Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчетных значений зависимой переменной (функции регрессии).
Решение всех названных задач приводит к необходимости комплексного использования этого метода.
Для характеристики влияния изменений Х на вариацию У служат методы регрессионного анализа. В случае парной линейной зависимости строится регрессионная модель:
Yi = ao + a1·Xi + ?i,i = 1,...,n,
где n - число наблюдений; ao , a1 - неизвестные параметры уравнения; ?i - ошибка случайной переменной У.
Уравнение регрессии записывается как
Уi теор = ao + a1·Xi,
где Уi теор - рассчитанное выравненное значение результативного признака после подстановки в уравнение Х.
Параметры ao и a1 оцениваются с помощью процедур, наибольшее распространение из которых получил метод наименьших квадратов. Его суть заключается в том, что наилучшие оценки ao и a1 получают, когда
?( Yi - Уi теор)? = min,
т.е. сумма квадратов отклонений эмпирических значений зависимой переменной от вычисленных по уравнению регрессии должна быть минимальной. Сумма квадратов отклонений является функцией параметров ao и a1. Ее минимизация осуществляется решением системы уравнений:
n ao + a1?X = ?У;
ao ?X + a1?X? = ?ХУ.
Важен смысл параметров: a1 - это коэффициент регрессии, характеризующий влияние, которое оказывает Х на У. Он показывает, на сколько единиц в среднем изменится У при изменении Х на одну единицу. Если a1 больше 0, то наблюдается положительная связь. Если a1 имеет отрицательное значение, то увеличение Х на единицу влечет за собой уменьшение У в среднем на a1. Параметр a1 обладает размерностью отношения У к Х.
Параметр ao - это постоянная величина в уравнении регрессии. Экономического смысла она не имеет, но в ряде случаев его интерпретируют как начальное значение У.