Образно говоря, мы заглядываем в куб (3-х мерное пространство) по очереди по трем осям и вначале ищем то направление, где видим наибольший “туман” (наибольшая дисперсия говорит о наибольшем влиянии чего-то постороннего); затем “усредняем” картинку по оставшимся двум осям и сравниваем разброс данных по каждой из них — находим “середнячка” и “аутсайдера”. Теперь остается решить систему уравнений — в нашем примере для 9 переменных, чтобы отыскать матрицу коэффициентов (весов) A[k·k].
Если коэффициенты Aj i найдены, то можно вернуться к основным переменным, поскольку доказано, что они однозначно выражаются в виде (суммирование по j=1…k)
X i= S Aji·Z j . {3-32}
Отыскание матрицы весов A[k·k] требует использования ковариационной матрицы и корреляционной матрицы.
Таким образом, метод главных компонент отличается прежде все тем, что дает всегда единственное решение задачи. Правда, трактовка этого решения своеобразна.
· Мы решаем задачу о наличии ровно стольких факторов, сколько у нас наблюдаемых переменных, т.е. вопрос о нашем согласии на меньшее число латентных факторов невозможно поставить;
· В результате решения, теоретически всегда единственного, а практически связанного с громадными вычислительными трудностями при разных физических размерностях основных величин, мы получим ответ примерно такого вида — фактор такой-то (например, привлекательность продавцов при анализе дневной выручки магазинов) занимает третье место по степени влияния на основные переменные.
Этот ответ обоснован — дисперсия этого фактора оказалась третьей по крупности среди всех прочих. Всё… Больше ничего получить в этом случае нельзя. Другое дело, что этот вывод оказался нам полезным или мы его игнорируем — это наше право решать, как использовать системный подход!
Несколько иначе осуществляется исследование латентных переменных в случае применения собственно факторного анализа. Здесь каждая реальная переменная рассматривается также как линейная комбинация ряда факторов Fj , но в несколько необычной форме
X i = S B ji · Fj + D i. {3-33} причем суммирование ведется по j=1…m , т.е. по каждому фактору.
Здесь коэффициент Bji принято называть нагрузкой на j-й фактор со стороны i-й переменной, а последнее слагаемое в {3-33} рассматривать как помеху, случайное отклонение для Xi. Число факторов m вполне может быть меньше числа реальных переменных n и ситуации, когда мы хотим оценить влияние всего одного фактора (ту же вежливость продавцов), здесь вполне допустимы.
Обратим внимание на само понятие “латентный”, скрытый, непосредственно не измеримый фактор. Конечно же, нет прибора и нет эталона вежливости, образованности, выносливости и т.п. Но это не мешает нам самим “измерить” их — применив соответствующую шкалу для таких признаков, разработав тесты для оценки таких свойств по этой шкале и применив эти тесты к тем же продавцам. Так в чем же тогда “ненаблюдаемость”? А в том, что в процессе эксперимента (обязательно) массового мы не можем непрерывно сравнивать все эти признаки с эталонами и нам приходится брать предварительные, усредненные, полученные совсем не в “рабочих” условиях данные.
Можно отойти от экономики и обратиться к спорту. Кто будет спорить, что результат спортсмена при прыжках в высоту зависит от фактора — “сила толчковой ноги”. Да, это фактор можно измерить и в обычных физических единицах (ньютонах или бытовых килограммах), но когда?! Не во время же прыжка на соревнованиях!
А ведь именно в это, рабочее время фиксируются статистические данные, накапливается материал для исходной матрицы.
Несколько более сложно объяснить сущность самих процедур факторного анализа простыми, элементарными понятиями (по мнению некоторых специалистов в области факторного анализа — вообще невозможно). Поэтому постараемся разобраться в этом, используя достаточно сложный, но, к счастью, доведенный в практическом смысле до полного совершенства, аппарат векторной или матричной алгебры.
До того как станет понятной необходимость в таком аппарате, рассмотрим так называемую основную теорему факторного анализа. Суть ее основана на представлении модели факторного анализа {3-33} в матричном виде
X [k·1] = B [k·m] · F [m·1] + D [k·1] {3-34}
и на последующем доказательстве истинности выражения
R [k·k] = B [k·m] · B*[m·k], {3-35}
для “идеального” случая, когда невязки D пренебрежимо малы.
Здесь B*[m·k] это та же матрица B [k·m], но преобразованная особым образом (транспонированная).
Трудность задачи отыскания матрицы нагрузок на факторы очевидна — еще в школьной алгебре указывается на бесчисленное множество решений системы уравнений, если число уравнений больше числа неизвестных. Грубый подсчет говорит нам, что нам понадобится найти k·m неизвестных элементов матрицы нагрузок, в то время как только около k2 / 2 известных коэффициентов корреляции. Некоторую “помощь” оказывает доказанное в теории факторного анализа соотношение между данным коэффициентом парной корреляции (например R12) и набором соответствующих нагрузок факторов:
R12 = B11 · B21 + B12 · B22 + … + B1m · B2m . {3-36}
Таким образом, нет ничего удивительного в том утверждении, что факторный анализ (а, значит, и системный анализ в современных условиях) — больше искусство, чем наука. Здесь менее важно владеть “навыками” и крайне важно понимать как мощность, так и ограниченные возможности этого метода.
Есть и еще одно обстоятельство, затрудняющее профессиональную подготовку в области факторного анализа — необходимость быть профессионалом в “технологическом” плане, в нашем случае это, конечно же, экономика.
Но, с другой стороны, стать экономистом высокого уровня вряд ли возможно, не имея хотя бы представлений о возможностях анализировать и эффективно управлять экономическими системами на базе решений, найденных с помощью факторного анализа.
Не следует обольщаться вульгарными обещаниями популяризаторов факторного анализа, не следует верить мифам о его всемогущности и универсальности. Этот метод “на вершине” только по одному показателю — своей сложности, как по сущности, так и по сложности практической реализации даже при “повальном” использовании компьютерных программ. К примеру, есть утверждения о преимуществах метода главных компонент — дескать, этот метод точнее расчета нагрузок на факторы. По этому поводу имеется одна острота известного итальянского статистика Карло Джинни, она в вольном пересказе звучит примерно так: “ Мне надо ехать в Милан, и я куплю билет на миланский поезд, хотя поезда на Неаполь ходят точнее и это подтверждено надежными статистическими данными. Почему? Да потому, что мне надо в Милан…”.
Выражая благодарность каждому, кто дочитал до этого места или прослушал все лекции и посетил все семинары, автор считает своим долгом сделать ряд пояснений, раскрыть свою позицию и свои взгляды на курс “Основы теории систем и системного анализа”.
· Место курса ТССА в ряду учебных дисциплин специальности “Учет и аудит” обусловлено прежде всего общим учебным планом, в первую очередь — разумной дисцпозицией всех дисциплин, с учетом их содержания и отводимого числа часов. Анализ (разумеется — системный!) общего рабочего плана специальности показывает, что курс ТССА должен излагаться после курса “Высшая математика” или, по крайней мере, в том семестре, в котором излагаются вопросы матричной алгебры. Кроме того, слушатели должны иметь представления о сути методов математической статистики, элементарных положениях теории вероятностей и иметь хотя бы начальные навыки обработки статистических данных. Отсюда второй вывод — данному курсу должно предшествовать изучение хотя бы введения в математическую статистику (в объеме не менее 2 час. лекций и 1 часа семинаров в неделю).
· Курс ТССА является теоретической и, главное, методолгической основой большинства специальных, экономических дисциплин (если, конечно, они излагаются на уровне современных информационных технологий). Поэтому данный курс должен читаться до таких дисциплин как “Экономическая статистика”, “Экономическо-математические методы и модели”, “Эконометрия”, “Экономический риск” и т.д.
· Несомненна целесообразность связей курса ТССА с такими дисциплинами как “Компъютерная техника и программирование”, а также
“Информационные системы учета”. Первая из них может считаться необходимой базой для знакомства слушателей с практикой решения задач системного анализа на ЭВМ, вторая — может служить естественным продолжением ТССА в такой специфической области как информатика.
· И, наконец, — о данном материале. Решение о необходимости его создания было принято кафедрой не только в связи с известными, временными трудностями только что созданного ВУЗа в вопросах обеспечения учебными и методическими пособиями. Сыграли роль и предвидимые кафедрой трудности восприятия курса слушателями, не имеющими “платформы знаний” в области статистики и необходимых вопросов математики.
Всё это и обусловило столь нестандартный, причудливый подход к изложению данного курса (1 час лекций в неделю и 1 час семинаров): основные узловые точки, фундаментальные понятия излагались на лекциях и, затем, движение по таким же вопросам продолжалось на семинарах, с акцентом на практических примерах.
· В заключение несколько слов о роли “практических” занятий по данному курсу. По мнению автора эти занятия могут быть полезны только в чистом виде “семинара” (группового занятия с коллективным обсуждением проблем системного анализа), но при этом не занимать половину аудиторного времени.