Полученная модель:
У = 348,349 + 35,788 Х1 -217,075 Х4 +305,687 Х7
Оценка качества модели.
Коэффициент детерминации R2 = 0,807
Показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 89% вариации зависимой переменной учтено и обусловлено в модели влиянием включенных факторов.
Коэффициент множественной корреляции R = 0,898
Показывает тесноту связи между зависимой переменной У со всеми включенными в модель объясняющими факторами.
Стандартная ошибка = 126,477
Коэффициент Дарбина - Уотсона = 2,136
Проверка значимости уравнения регрессии
Значение критерия F-Фишера = 41,687
Уравнение регрессии следует признать адекватным, модель считается значимой.
Самый значимый фактор – количество комнат (F=41,687)
Второй по значимости фактор- общая площадь (F= 40,806)
Третий по значимости фактор- район (F= 32,288)
7. Фиктивная переменная Х4 является значимым фактором, поэтому целесообразно включить ее в уравнение.
Интервальные оценки параметров уравнения показывают результаты прогнозирования по модели регрессии.
С вероятностью 95% объем реализации в прогнозируемом месяце составит от 540,765 до 1080,147 млн. руб.
8. Определение стоимости квартиры в элитном районе
Для 1 комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 1
Для 2 комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 2
Для 3 комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 3
в периферийном
Для 1 комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 1
Для 2 комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 2
Для 3 комн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 3
Глава 2. Кластерный анализ
Задание: Исследование структуры денежных расходов и сбережений населения.
В таблице представлена структура денежных расходов и сбережений населения по регионам Центрального федерального округа Российской федерации в 2003 г. Для следующих показателей:
· ПТиОУ – покупка товаров и оплата услуг;
· ОПиВ – обязательные платежи и взносы;
· ПН – приобретение недвижимости;
· ПФА – прирост финансовых активов;
· ДР – прирост (уменьшение) денег на руках у населения.
Рис. 8 Исходные данные
Требуется:
1) определить оптимальное количество кластеров для разбиения регионов на однородные группы по всем группировочным признакам одновременно;
2) провести классификацию областей иерархическим методом с алгоритмом межгрупповых связей и отобразить результаты в виде дендрограммы;
3) проанализировать основные приоритеты денежных расходов и сбережений в полученных кластерах;
4) сравнить полученную классификацию с результатами применения алгоритма внутригрупповых связей.
Выполнение:
1) Определить оптимальное количество кластеров для разбиения регионов на однородные группы по всем группировочным признакам одновременно;
Для определения оптимального количества кластеров нужно воспользоваться Иерархическим кластерным анализом и обратиться к таблице «Шаги агломерации» к столбцу «Коэффициенты».
Эти коэффициенты подразумевают расстояние между двумя кластерами, определенное на основании выбранной дистанционной меры (Евклидово расстояние). На том этапе, когда мера расстояния между двумя кластерами увеличивается скачкообразно, процесс объединения в новые кластеры необходимо остановить.
В итоге, оптимальным считается число кластеров, равное разности количества наблюдений (17) и номера шага (14),после которого коэффициент увеличивается скачкообразно. Таким образом, оптимальное количество кластеров равно 3. (Рис.9)
статистический математический анализ кластерный
Рис. 9 Таблица «Шаги агломерации»
2) Провести классификацию областей иерархическим методом с алгоритмом межгрупповых связей и отобразить результаты в виде дендрограммы;
Теперь, используя оптимальное количество кластеров, проводим классификацию областей иерархическим методом. И в выходных данных обращаемся к таблице «Принадлежность к кластерам». (Рис.10)
Рис. 10 Таблица «Принадлежность к кластерам»
На Рис. 10 отчетливо видно, что в 3 кластер попали 2 области (Калужская, Московская) и г. Москва, во 2 кластер две (Брянская, Воронежская, Ивановская, Липецкая, Орловская, Рязанская, Смоленская, Тамбовская, Тверская), в 1 кластер – Белгородская, Владимирская, Костромская, Курская, Тульская, Ярославская.
Рис. 11 Дендрограмма
3) проанализировать основные приоритеты денежных расходов и сбережений, в полученных кластерах;
Для анализа полученных кластеров нам нужно провести «Сравнение средних». В выходном окне выводится следующая таблица (Рис. 12)
Рис. 12 Средние значения переменных
В таблице «Средних значений» мы можем проследить, каким структурам отдается наибольший приоритет в распределении денежных расходов и сбережений населения.
В первую очередь стоит отметить, что самый высокий приоритет во всех областях отдается покупке товаров и оплате услуг. Большее значение параметр принимает в 3 кластере.
2 место занимает прирост финансовых активов. Наибольшее значение в 1 кластере.
Наименьший коэффициент в 1 и 2 кластерах у «приобретение недвижимости», а в 3 кластере выявлено заметное уменьшение денег на руках у населения.
В целом особое значение для населения имеет покупка товаров и оплата услуг и незначительное покупка недвижимости.
4) сравнить полученную классификацию с результатами применения алгоритма внутригрупповых связей.
В анализе межгрупповых связей ситуация практически не изменилась, за исключением Тамбовской области, которая из 2 кластера попала в 1.(Рис.13)
Рис. 13 Анализ внутригрупповых связей
В таблице «Средних значений» никаких изменений не произошло.
Глава 3. Факторный анализ
Задание: Анализ деятельности предприятий легкой промышленности.
Имеются данные обследований 20 предприятий легкой промышленности (Рис. 14) по следующим характерным признакам:
· Х1 – уровень фондоотдачи;
· Х2 – трудоемкость единицы продукции;
· Х3 – удельный вес закупочных материалов в общих расходах;
· Х4 – коэффициент сменности оборудования;
· Х5 – премии и вознаграждения на одного работника;
· Х6 – удельный вес потерь от брака;
· Х7 – среднегодовая стоимость основных производственных фондов;
· Х8 – среднегодовой фонд заработной платы;
· Х9 – уровень реализуемости продукции;
· Х10 – индекс постоянного актива (отношение основных средств и прочих внеоборотных активов к собственным средствам);
· Х11 – оборачиваемость оборотных средств;
· Х12 – непроизводственные расходы.
Рис.14 Исходные данные
Требуется:
1. провести факторный анализ следующих переменных: 1,3,5-7, 9, 11,12, выявить и интерпретировать факторные признаки;
2. указать наиболее благополучные и перспективные предприятия.
Выполнение:
1. Провести факторный анализ следующих переменных: 1,3,5-7, 9, 11,12, выявить и интерпретировать факторные признаки.
Факторный анализ – это совокупность методов, которые на основе реально существующих связей объектов (признаков) позволяют выявить латентные (неявные) обобщающие характеристики организационной структуры.
В диалоговом окне факторного анализа выбираем наши переменные, указываем необходимые параметры.
Рис. 15 Полная объясненная дисперсия
По таблице «Полной объясненной дисперсии» видно, что выделены 3 фактора, объясняющие 74,8 % вариаций переменных – построенная модель достаточно хорошая.
Теперь интерпретируем факторные признаки по «Матрице повернутых компонент»: (Рис.16).
Рис. 16 Матрица повернутых компонент
Фактор 1 наиболее тесно связан с уровнем реализации продуктов и имеет обратную зависимость от непроизводственных расходов.
Фактор 2 наиболее тесно связан с удельным весом закупочных материалов в общих расходах и удельным весом потерь от брака и имеет обратную зависимость от премий и вознаграждений на одного работника.
Фактор 3 наиболее тесно связан с уровнем фондоотдачи и оборачиваемость оборотных средств и имеет обратную зависимость от среднегодовой стоимости основных производственных фондов.
2. Указать наиболее благополучные и перспективные предприятия.
Для того, чтобы выявить наиболее благополучные предприятия проведем сортировку данных по 3 факторным признакам по убыванию. (Рис.17)
Рис. 17
Наиболее благополучными предприятиями следует считать: 13,4,5, так как в целом по 3 факторам их показатели занимают наиболее высокие и стабильные позиции.
Глава 4. Дискриминантный анализ
Оценка кредитоспособности юридических лиц в коммерческом банке
В качестве значимых показателей, характеризующих финансовое состояние организаций-заемщиков, банком выбраны шесть показателей (табл. 4.1.1):
QR (Х1) — коэффициент срочной ликвидности;
CR (Х2) — коэффициент текущей ликвидности;