Если
, линейная связь между переменными и отсутствует.Значение
указывает на наличие функциональной линейной зависимости между ними.По мере приближения
к единице условные дисперсии стремятся к нулю, что свидетельствует о меньшем рассеянии значений переменных , относительно соответствующих линий регрессии и о более тесной связи между данными переменными.Положительный знак коэффициента корреляции означает, что прямые регрессии имеют в координатной плоскости
положительный тангенс угла наклона, с увеличением (или уменьшением) значения любой из переменных , пропорционально в среднем возрастает (соответственно убывает) значение другой переменной.Отрицательный знак коэффициента корреляции указывает на обратную тенденцию.
Функции регрессии
на и на находятся с помощью формул, определяющих условные математические ожидания: ,При этом условные плотности распределения вероятностей случайных величин
, представляются в виде отношений известных безусловных плотностей распределения:Дальнейшее интегрирование функций
, по x, соответственно по y, непосредственно дает уравнение регрессии на , а также уравнение регрессии на : ; , ; ,где
- коэффициент регрессии на ; - коэффициент регрессии на .Линейный характер корреляционной зависимости между совместно нормально распределенными случайными величинами проявляется в том, что с изменением одной величины пропорционально изменяется условное математическое ожидание другой величины. Графики функций регрессии (именуемые линиями регрессии) представляют собой прямые.
В случае некоррелированности
, , т.е. при , прямые регрессии на и на параллельны соответственно координатным осям и .Парный коэффициент детерминации
Степень рассеяния значений
(или ) относительно линии регрессии на (или на ) характеризуют (в среднем) условные дисперсии:Расчетные формулы для
и находятся подобно тому, как определялись функции регрессии на и на .В итоге,
.Квадрат коэффициента корреляции называется парным коэффициентом детерминации.
Из приведенных выражений для условных дисперсий следует, что величина
указывает долю дисперсии одной случайной величины, обусловленную вариацией другой случайной величины.Эмпирические характеристики корреляционной зависимости
В практике статистических исследований параметры совместного распределения вероятностей случайных величин, включенных в анализ, как правило, неизвестны, и тесноту связи между переменными оценивают по статистическим данным и выборочным аналогам корреляционных характеристик.
С этой целью в двумерном корреляционном анализе используют "поле корреляции", строят корреляционную таблицу, рассчитывают точечные оценки параметров корреляционной модели, проверяют значимость параметров связи и находят интервальные оценки для значимых параметров, оценивают уравнения регрессии.
Корреляционным полем называется совокупность нанесенных на координатную плоскость
реализаций случайного вектора , т.е. выборочных точек .По расположению точек корреляционного поля можно составить предварительное мнение о характерных особенностях зависимости случайных величин (например, о том, что значение какой-либо из этих величин в среднем возрастает или убывает при возрастании значения другой величины).
Наиболее точную информацию о направлении и силе связи между величинами
, дают коэффициент корреляции и уравнения регрессии.Корреляционная таблица
В понятийном смысле - представляет собой обобщение понятия «вариационный ряд», с прикладной точки зрения - является формой компактной записи выборочных данных
двумерной случайной величины :… | … | ||||||
… … … … | … … … … | ||||||
… | … | n |
где