Основы теории систем и системный анализ (стр. 18 из 21)

Сразу же сообразим, что чем больше n и чем меньше таких число факторов m (а может их и нет вообще!), тем больше надежда оценить их влияние на интересующий нас показатель E.

Столь же легко понять необходимость условия m < k, объяснимого на простом примере аналогии — если мы исследуем некоторые предметы с использованием всех 5 человеческих чувств, то наивно надеяться на обнаружение более пяти “новых”, легко объяснимых, но неизмеряемых признаков у таких предметов, даже если мы “испытаем” очень большое их количество.

Вернемся к исходной матрице наблюдений E[n·k] и отметим, что перед нами, по сути дела, совокупности по n наблюдений над каждой из k случайными величинами E₁, E₂, … E _k. Именно эти величины “подозреваются” в связях друг с другом — или во взаимной коррелированности.

Из рассмотренного ранее метода оценок таких связей следует, что мерой разброса случайной величины E _i служит ее дисперсия, определяемая суммой квадратов всех зарегистрированных значений этой величины S(E_ij)²и ее средним значением (суммирование ведется по столбцу).

Если мы применим замену переменных в исходной матрице наблюдений, т.е. вместо E_{i j} будем использовать случайные величины

X_ij =

, {3-27}

то мы преобразуем исходную матрицу в новую

X[n·k] {3-28}

X ₁₁	X₁₂	…	X_1i	…	X_1k
X ₂₁	X₂₂	…	X_2i	…	X_2k
…	…	…	…	…	…
X _j1	X_j2	…	X_ji	…	X_jk
…	…	…	…	…	…
X _n1	X_n2	…	X_ni	…	X_nk

Отметим, что все элементы новой матрицы X[n·k] окажутся безразмерными, нормированными величинами и, если некоторое значение X_ijсоставит, к примеру, +2, то это будет означать только одно - в строке j наблюдается отклонение от среднего по столбцу i на два среднеквадратичных отклонения (в большую сторону).

Выполним теперь следующие операции.

· Просуммируем квадраты всех значений столбца 1 и разделим результат на (n - 1) — мы получим дисперсию (меру разброса) случайной величины X₁, т.е. D₁. Повторяя эту операцию, мы найдем таким же образом дисперсии всех наблюдаемых (но уже нормированных) величин.

· Просуммируем произведения соответствующих строк (от j =1 до j = n) для столбцов 1,2 и также разделим на (n -1). То, что мы теперь получим, называется ковариацией C₁₂случайных величин X₁, X₂и служит мерой их статистической связи.

· Если мы повторим предыдущую процедуру для всех пар столбцов, то в результате получим еще одну, квадратную матрицу C[k·k], которую принято называть ковариационной.

Эта матрица имеет на главной диагонали дисперсии случайных величин X_i, а в качестве остальных элементов — ковариации этих величин ( i =1…k).

Ковариационная матрица C[k·k] {3-29}

D₁	C₁₂	C₁₃	…	…	C_1k
C₂₁	D₂	C₂₃	…	…	C_2k
…	…	…	…	…	…
C_j1	C_j2	…	C_ji	…	C_jk
…	…	…	…	…	…
C_n1	C_n2	…	C_ni	…	D_k

Если вспомнить, что связи случайных величин можно описывать не только ковариациями, но и коэффициентами корреляции, то в соответствие матрице {3-29} можно поставить матрицу парных коэффициентов корреляции или корреляционную матрицу

R [k·k] {3-30}

1	R₁₂	R₁₃	…	…	R_1k
R₂₁	1	R₂₃	…	…	R_2k
…	…	…	…	…	…
R_j1	R_j2	…	R_ji	…	R_jk
…	…	…	…	…	…
R_n1	R_n2	…	R_ni	…	1

в которой на диагонали находятся 1, а внедиагональные элементы являются обычными коэффициентами парной корреляции.

Так вот, пусть мы полагали наблюдаемые переменные Ei независящими друг от друга, т.е. ожидали увидеть матрицу R[k·k] диагональной, с единицами в главной диагонали и нулями в остальных местах. Если теперь это не так, то наши догадки о наличии латентных факторов в какой-то мере получили подтверждение.

Но как убедиться в своей правоте, оценить достоверность нашей гипотезы — о наличии хотя бы одного латентного фактора, как оценить степень его влияния на основные (наблюдаемые) переменные? А если, тем более, таких факторов несколько — то как их проранжировать по степени влияния?

Ответы на такие практические вопросы призван давать факторный анализ. В его основе лежит все тот же “вездесущий” метод статистического моделирования (по образному выражению В.В.Налимова — модель вместо теории).

Дальнейший ход анализа при выяснению таких вопросов зависит от того, какой из матриц мы будем пользоваться. Если матрицей ковариаций C[k·k], то мы имеем дело с методом главных компонент, если же мы пользуемся только матрицей R[k·k], то мы используем метод факторного анализа в его “чистом” виде.

Остается разобраться в главном — что позволяют оба эти метода, в чем их различие и как ими пользоваться. Назначение обоих методов одно и то же — установить сам факт наличия латентных переменных (факторов), и если они обнаружены, то получить количественное описание их влияния на основные переменные E_i.

Ход рассуждений при выполнении поиска главных компонент заключается в следующем. Мы предполагаем наличие некоррели-рованных переменных Z_j( j=1…k), каждая из которых представляется нам комбинацией основных переменных (суммирование по i =1…k):

Z_j = S A_{j i}·X _i{3-31}

и, кроме того, обладает дисперсией, такой что

D(Z₁) ³ D(Z₂) ³ … ³ D(Z_k).

Поиск коэффициентов A_{j i}(их называют весом j-й компонеты в содержании i-й переменной₎ сводится к решению матричных уравнений и не представляет особой сложности при использовании компьютерных программ. Но суть метода весьма интересна и на ней стоит задержаться.

Как известно из векторной алгебры, диагональная матрица [2·2] может рассматриваться как описание 2-х точек (точнее — вектора) в двумерном пространстве, а такая же матрица размером [k·k]— как описание k точек k-мерного пространства.

Так вот, замена реальных, хотя и нормированных переменных X_iна точно такое же количество переменных Z _jозначает не что иное, как поворот k осей многомерного пространства.

“Перебирая” поочередно оси, мы находим вначале ту из них, где дисперсия вдоль оси наибольшая. Затем делаем пересчет дисперсий для оставшихся k-1 осей и снова находим “ось-чемпион” по дисперсии и т.д.