Задача 1. Корреляционный анализ
Исследовано функционирование некоторого предприятия торговли в течение n месяцев. Необходимо проанализировать наличие предполагаемой зависимости между: расходами предприятия на рекламу и продвижение товаров на рынок
, (в тыс. грн); расходами на обучение и повышение квалификации персонала Yi, (в тыс. грн.); объемом товарооборота предприятия торговли Ui, (в млн. грн.); прибылью предприятия Zi, (в тыс. грн.).X | Y | U | Z |
82 | 101 | 48 | 34 |
100 | 106 | 52 | 24 |
85 | 66 | 51 | 36 |
85 | 80 | 47 | 33 |
102 | 71 | 49 | 23 |
102 | 80 | 54 | 24 |
85 | 119 | 46 | 35 |
88 | 66 | 49 | 30 |
90 | 84 | 50 | 30 |
84 | 94 | 46 | 33 |
83 | 73 | 47 | 32 |
87 | 59 | 47 | 31 |
102 | 79 | 52 | 24 |
80 | 116 | 44 | 36 |
80 | 103 | 48 | 33 |
96 | 76 | 52 | 27 |
95 | 89 | 52 | 27 |
81 | 66 | 45 | 34 |
Провести предварительный анализ (описательную статистику) исследуемых компонентов многомерной случайной величины
Для всех пар случайных величин построить диаграммы рассеивания (корреляционные поля).
Рассчитать матрицу выборочных парных коэффициентов корреляции. Сделать выводы о степени тесноты и тенденции связи между парами компонентов исследуемого многомерного признака в терминах решаемой прикладной задачи.
Проверить гипотезу об отсутствии корреляционной связи между двумя компонентами случайной величины (X,Z).
Построить доверительные интервалы для двух парных коэффициентов корреляции при р=0.95 (X,Z;Y,Z).
Исключив из рассмотрения случайную величину, не зависящую от других, для оставшихся случайных величин рассчитать матрицу частных коэффициентов корреляции.
Рассчитать парные ранговые коэффициенты корреляции Спирмена и Кендалла для двух компонентов многомерной случайной величины (U,Y).
Рассчитать корреляционные отношения между случайными величинами, для которых можно предположить наличие нелинейной связи.
Рассчитать коэффициент конкордации для трех случайных величин, между которыми на основе проведенного анализа можно предположить наличие статистической связи.
Проверить гипотезу о статистической значимости исследуемой множественной связи.
В терминах решаемой прикладной задачи дать содержательную интерпретацию результатов для каждого из пунктов.
РЕШЕНИЕ
1. Построим диаграммы рассеивания
2. Рассчитаем матрицу выборочных парных коэффициентов корреляции при помощи пакета анализа программы Excel:
Δ U | Δ X | Δ Y | |
Δ U | 1 | ||
Δ X | 0,80766 | 1 | |
Δ Y | -0,3689 | -0,19614 | 1 |
Анализ полученных коэффициентов парной корреляции показывает, что зависимая переменная, т.е. объем товарооборота предприятия торговли имеет сильную прямую связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,81≤1) и слабую обратную связь с расходами на обучение и повышение квалификации персонала (0,37≤0,4). Мультиколлинеарность отсутствует, т.к. коэффициент парной корреляции равен -0,196, что не превышает значения 0,7-0,8.
Δ Z | Δ X | Δ Y | |
Δ Z | 1 | ||
Δ X | -0,95998 | 1 | |
Δ Y | 0,215933 | -0,19614 | 1 |
Анализ полученных коэффициентов парной корреляции показывает, что зависимая переменная, т.е. прибыль предприятия торговли имеет сильную обратную связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,96≤1) и слабую прямую связь с расходами на обучение и повышение квалификации персонала (0,22≤0,4). Мультиколлинеарность отсутствует, т.к. коэффициент парной корреляции равен -0,196, что не превышает значения 0,7-0,8.
3. Проверить гипотезу об отсутствии корреляционной связи между двумя компонентами случайной величины (X,Z):
В предыдущем пункте проверка гипотезы об отсутствии корреляционной связи между расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия была опровергнута, т.к. проверка коэффициентов парной корреляции показывает, что зависимая переменная, т.е. прибыль предприятия торговли имеет сильную обратную связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,96≤1).
4. Построить доверительные интервалы для двух парных коэффициентов корреляции при р=0.95 (X,Z;Y,Z)
Полагая доверительную вероятность р = 0,95 т. е. вероятность, с которой гарантируются результаты, равной 0,95, находим соответствующее ей значение критерия Стьюдента t, равное 2,1009. Воспользовавшись формулой средней квадратической ошибки, где вместо р возьмем рассчитанный выборочный коэффициент корреляции r, получим значение для средней квадратической ошибки X,Z: р = 0,95; r = - 0,96
Поскольку tσr= 2,1009 х 0,018 = 0,0388 верхняя и нижняя границы равны соответственно -0,9212 и -0,9988. Другими словами, с вероятностью 0,95 коэффициент корреляции данной совокупности находится в пределах от -0,9212 до -0,9988. Y,Z: р = 0,95; r = 0,216
Поскольку tσr= 2,1009 х 0,22 = 0,47 верхняя и нижняя границы равны соответственно 0,69 и -0,25. Другими словами, с вероятностью 0,95 коэффициент корреляции данной совокупности находится в пределах от -0,25 до 0,69.
6. Рассчитать парные ранговые коэффициенты корреляции Спирмена и Кендалла для двух компонентов многомерной случайной величины (U,Y).
Запишем ранги:
U | 48 | 52 | 51 | 47 | 49 | 54 | 46 | 49 | 50 | 46 | 47 | 47 | 52 | 44 | 48 | 52 | 52 | 45 |
№ Z | 11 | 5 | 6 | 14 | 9 | 1 | 16 | 8 | 7 | 15 | 13 | 12 | 4 | 18 | 10 | 3 | 2 | 17 |
№ X | 15 | 4 | 12 | 11 | 3 | 2 | 10 | 8 | 7 | 13 | 14 | 9 | 1 | 18 | 17 | 5 | 6 | 16 |
-4 | 1 | -6 | 3 | 6 | -1 | 6 | 0 | 0 | 2 | -1 | 3 | 3 | 0 | -7 | -2 | -4 | 1 | |
16 | 1 | 36 | 9 | 36 | 1 | 36 | 0 | 0 | 4 | 1 | 9 | 9 | 0 | 49 | 4 | 16 | 1 |
Σ
= 228Тогда критерий Спирмена равен:
r = 0,765, это больше табличного значения критерия, значит корреляция достоверно отличается от 0.
Критерий Кендалла:
r = 4*153/(18*17) – 1 = -0,5
Значит между объемом товарооборота предприятия торговли и расходами предприятия на рекламу и продвижение товаров на рынок существует обратная средней тесноты связь.
Y | 101 | 106 | 66 | 80 | 71 | 80 | 119 | 66 | 84 | 94 | 73 | 59 | 79 | 116 | 103 | 76 | 89 | 66 |
Z | 4 | 15 | 1 | 6 | 18 | 16 | 3 | 11 | 12 | 7 | 9 | 10 | 17 | 2 | 8 | 13 | 14 | 5 |
X | 15 | 4 | 10 | 11 | 1 | 2 | 12 | 8 | 7 | 13 | 14 | 9 | 3 | 17 | 18 | 5 | 6 | 16 |
-11 | 11 | -9 | -5 | 17 | 14 | -9 | 3 | 5 | -6 | -5 | 1 | 14 | -15 | -10 | 8 | 8 | -11 | |
121 | 121 | 81 | 25 | 289 | 196 | 81 | 9 | 25 | 36 | 25 | 1 | 196 | 225 | 100 | 64 | 64 | 121 |
Σ
= 1780Тогда критерий Спирмена равен:
r = -0,837, это значит корреляция недостоверна. Значит между объемом товарооборота предприятия торговли и расходами на обучение и повышение квалификации персонала не существует связи.
7. Рассчитаем корреляционные отношения между случайными величинами, для которых можно предположить наличие нелинейной связи: расходами предприятия на рекламу и продвижение товаров на рынок и объемом товарооборота предприятия торговли; расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия.
Коэффициенты корреляции:
Rxu = 0,8
Rxz = -0,96
8. Рассчитаем коэффициент конкордации для расходов предприятия на рекламу и продвижение товаров на рынок, объемом товарооборота предприятия торговли и продвижение товаров на рынок и прибылью предприятия, между которыми на основе проведенного анализа можно предположить наличие статистической связи
W = 0.88 – значит согласованность показателей стремиться к полной.
После проведении анализа можно сделать следующие выводы:
- объем товарооборота предприятия торговли имеет сильную прямую связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,81≤1) и слабую обратную связь с расходами на обучение и повышение квалификации персонала (0,37≤0,4);