Смекни!
smekni.com

Корреляционный анализ (стр. 2 из 6)

Если

, линейная связь между переменными
и
отсутствует.

Значение

указывает на наличие функциональной линейной зависимости между ними.

По мере приближения

к единице условные дисперсии
стремятся к нулю, что свидетельствует о меньшем рассеянии значений переменных
,
относительно соответствующих линий регрессии и о более тесной связи между данными переменными.

Положительный знак коэффициента корреляции означает, что прямые регрессии имеют в координатной плоскости

положительный тангенс угла наклона, с увеличением (или уменьшением) значения любой из переменных
,
пропорционально в среднем возрастает (соответственно убывает) значение другой переменной.

Отрицательный знак коэффициента корреляции указывает на обратную тенденцию.

Уравнения линейной парной регрессии

Функции регрессии

на
и
на
находятся с помощью формул, определяющих условные математические ожидания:

,

При этом условные плотности распределения вероятностей случайных величин

,
представляются в виде отношений известных безусловных плотностей распределения:

Дальнейшее интегрирование функций

,
по x, соответственно по y, непосредственно дает уравнение регрессии
на
, а также уравнение регрессии
на
:

;

,

;
,

где

- коэффициент регрессии
на
;

- коэффициент регрессии
на
.

Линейный характер корреляционной зависимости между совместно нормально распределенными случайными величинами проявляется в том, что с изменением одной величины пропорционально изменяется условное математическое ожидание другой величины. Графики функций регрессии (именуемые линиями регрессии) представляют собой прямые.

В случае некоррелированности

,
, т.е. при
, прямые регрессии
на
и
на
параллельны соответственно координатным осям
и
.

Парный коэффициент детерминации

Степень рассеяния значений

(или
) относительно линии регрессии
на
(или
на
) характеризуют (в среднем) условные дисперсии:

Расчетные формулы для

и
находятся подобно тому, как определялись функции регрессии
на
и
на
.

В итоге,

.

Квадрат коэффициента корреляции называется парным коэффициентом детерминации.

Из приведенных выражений для условных дисперсий следует, что величина

указывает долю дисперсии одной случайной величины, обусловленную вариацией другой случайной величины.

Эмпирические характеристики корреляционной зависимости

В практике статистических исследований параметры совместного распределения вероятностей случайных величин, включенных в анализ, как правило, неизвестны, и тесноту связи между переменными оценивают по статистическим данным и выборочным аналогам корреляционных характеристик.

С этой целью в двумерном корреляционном анализе используют "поле корреляции", строят корреляционную таблицу, рассчитывают точечные оценки параметров корреляционной модели, проверяют значимость параметров связи и находят интервальные оценки для значимых параметров, оценивают уравнения регрессии.

Корреляционное поле

Корреляционным полем называется совокупность нанесенных на координатную плоскость

реализаций случайного вектора
, т.е. выборочных точек
.

По расположению точек корреляционного поля можно составить предварительное мнение о характерных особенностях зависимости случайных величин (например, о том, что значение какой-либо из этих величин в среднем возрастает или убывает при возрастании значения другой величины).

Наиболее точную информацию о направлении и силе связи между величинами

,
дают коэффициент корреляции и уравнения регрессии.

Корреляционная таблица

В понятийном смысле - представляет собой обобщение понятия «вариационный ряд», с прикладной точки зрения - является формой компактной записи выборочных данных

двумерной случайной величины
:
… …
… …
n

где