Рис. 4. Внешний вид окна Correlation.
Для получения коэффициента корреляции между валовым доходом и расходом на продукты необходимо указать в окне «Переменные» (Variables) колонки С1 и С2.
В результате выполнение данной операции в окне результатов (Session Window) появится следующие данные:
Pearson correlation of Salary and Расходнапродукту = 0,975.
Мы можем сделать вывод, что между этими показателями присутствует прямая связь, и что показатель расходы на продукцию зависит от валового дохода.
Для получения суммарного показателя по столбцу (суммы, среднего) и т.д. необходимо зайти Calc > Columnstatisticsи заполнить диалоговое окно, как это показано на рисунке 5.
Рис. 5. Диалоговое окно статистики по столбцам.
Ранжирование данных осуществляется следующим образом: Manip > Rank. На экране появится окно, которое показано на рис. 6.
Рис. 6. Внешний вид окна Rank.
Для ранжирования данных необходимо указать следующие характеристики: название колонки, которая будет ранжирована (для этого необходимо дважды щелкнуть мышкой по названию колонки, расположенной на экране с левой стороны) и название колонки, в которой будут храниться ранги колонки.
Для построения графиков необходимо выполнить следующие действия: Graph > (Plot, Chart, Histogram, Boxplot, Time Series Plot). После выбора команды Graph необходимо выбрать один из типов графиков, которые перечислены в скобках. Если выбрали Plot, то в результате на экране появится диалоговое окно, которое показано на рисунке 7.
Рис. 7. Внешний вид диалогового окна Plot.
Необходимо указать какая из колонок будет являться X, а какая Y. После этого нажать OK или клавишу «Enter». На экране появится график, изображенный на рисунке 8.
Рис. 8. График, полученный при построении в режиме Plot.
3.2. Дисперсионный анализ показателей уровня жизни населения
Дисперсионный анализ применяется во всех областях научных исследований, где необходимо проанализировать влияние различных факторов на исследуемую переменную. Применим дисперсионный анализ при изучении показателей уровня жизни в следующем пункте.
Дисперсионный анализ – анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов. С помощью дисперсионного анализа изучим показатели уровня жизни населения, представленные в таблице 13 (см. приложение 8).
Дисперсионный анализ применяется во всех областях научных исследований, где необходимо проанализировать влияние различных факторов на исследуемую переменную. Применим дисперсионный анализ при изучении показателей уровня жизни в следующем пункте.
При исследовании зависимости средней оценки Y по математической статистике в группе от показателей уровня жизни (В1 — расходы на здравоохранение на душу населения, В2— количество больничных коек на 10000 человек, В3— количество человек на 1 врача, В4 — обеспеченность водой на душу населения, В5—протяженность автомобильных дорог,В6—количество человек на 1 транспортное средство), стран (А1—Россия, А2—Азербайджан, А3—Белоруссия, А4—Грузия, А5—Казахстан, А6—Молдавия, А7—Таджикистан, А8—Узбекистан) и их взаимодействия было выделено случайным образом 48 групп, которые приписывались в равных количествах. Данные необходимые для проведения двухфакторного дисперсионного анализа приведены в табл.13(см. приложение8).
1. Детерминированная модель двухфакторного дисперсионного анализа (с повторениями) средней оценки по математической статистике в группе имеет следующий вид:
=1,2,3,4,5,6; =1,2,3,4,5,6,7где
— неслучайные эффекты влияния на наблюдение уровней факторов A и B и взаимодействия этих уровней, — случайный эффект влияния прочих неконтролируемых факторов.К этой модели предъявляются следующие требования:
· Все n = 6*7=42 случайных величин
или, иначе все 36 наблюдений должны быть независимыми;·
или, иначе, , т.е при каждой комбинации уровней факторов наблюдения должны проводиться в одинаковых (нормальных) вероятностных условиях с дисперсией, не изменяющейся при переходе от одной комбинации уровней факторов к другой;·
2. Введем исходные данные в рабочий лист Microsoft Excel (рис.9).
Для исследования модели воспользуемся программой «Двухфакторный
дисперсионный анализ с повторениями», выбрав соответствующий пункт меню надстройки «Анализ данных».
В появившемся окне ввода данных (рис. 10) укажем входной интервал
A1:G8, в который мы ввели исходные данные (с заголовками групп строк и столбцов — обозначениями уровней факторов), число строк для выборки
(число наблюдений при каждой комбинации уровней факторов), уровень значимости Альфа (по условию α = 0,05). Укажем, что результаты работы программы необходимо вывести на новый рабочий лист.
Результаты работы программы представлены на рис. 9.
Рис. 9. Числовые данные для программы
«Двухфакторный дисперсионный анализ с повторениями»
Рис.10. Окно ввода данных программы
«Двухфакторный дисперсионный анализ»Рис.11. Результаты работы программы
«Двухфакторный дисперсионный анализ»
Таблица «Дисперсионный анализ», полученная в результате работы программы (рис. 11), представляет собой дисперсионную таблицу.
В этой таблице «Выборка» — это фактор A, «Столбцы» — это фактор В, «Взаимодействие» — это взаимодействие факторов Aи B, «Внутри» — это неконтролируемые факторы, «SS» — сумма квадратов, «df» — число степеней свободы, «MS» – средняя сумма квадратов, равная отношению SS к df, «F» — числовое значение статистики F, соответствующей проверяемой гипотезе, «P-
значение» — это рассчитанный уровень значимости, «F критическое» —
100α%-ная критическая точка распределения Фишера — Снедекора с соответствующими числами степеней свободы.
Источник вариации величины Y | Показатель вариации (SS) | Число степеней свободы(df) | Оценка дисперсии |
Фактор А(выборка) | =0 | =6 | =65535 |
Фактор В(столбцы) | =0 | =5 | ==30922890603 |
Взаимодействие факторов А и В | =65535 | =1 | ==65535 |
Остаточные факторы(внутри) | =15595873525 | =0 | ==623834941 |
Общая вариация | =27967435937 | =41 |
Рассмотрим дисперсионную таблицу ниже:
В условиях задачи
=7, =6, =6. ; ; .