Смекни!
smekni.com

Интервальная группировка (стр. 3 из 5)

3.


Выполнить расчет в колонке xSri*fi . Для этого в первую ячейку колонки E5 ввести формулу [=B5*C5], затем выполнить копирование ее в остальные ячейки колонки.

4. Используя функцию СУММ() или нажать кнопку Автосуммирование, определить итоговые суммы в колонках fi и xSRi×fi (ячейки C14, E14).

5. Рассчитать среднее значение

. Для этого в ячейку E18 ввести формулу [=E14/C14].

6. В следующих колонках выполнить вычисления: (xsri -`x )2×fi, (xsri -`x)3×fi, (xsri -`x)4×fi. Необходимо помнить, что `x - средняя арифметическая является скалярной величиной, поэтому ссылка на ячейку, содержащую значения `x должна быть абсолютной. Формулы в ячейках F5, G5, H5 будут такими: [=(B5-$F$18)^2*C5], [=(B5-$F$18)^3*C5], [=(B5-$F$18)^4*C5]. Выполнить копирование формул в остальные ячейки колонок таблицы.

7. Вычислить итоговые суммы в колонках "(xsri -`x )2×fi", "(xsri -`x)3×fi", "(xsri -`x)4×fi". Для этого используется встроенная функция СУММ() или нажать кнопку Автосуммирования.

8. Рассчитать значения дисперсии d2, среднего квадратического отклонения d, центральных моментов М3, М4, коэффициента асимметрии AS, показателя эксцесса Е. (2.7, 2.8, 2.9, 2.10). Результаты расчета оформляются в виде табл.3.7 рис.2.6. В соответствующие ячейки колонок "значения" записываются следующие формулы: в E19 – [=F14/C14], в E21 – [=КОРЕНЬ(Е19)], в H19 – [=G14/C14], в H20 – [= H14/C14], в H21 – [=H19/E21^3], в H22 – [=H20/E21^4-3].

9. Рассчитываются значения медианы Ме и моды Мо. (2.11, 2.12). Т.к. значение частоты fi в i-ой строке таблицы соответствует интервалу [xi-1;xi], то в качестве начала медианного интервала xme и модального интервала xmo берутся значения интервала из предшествующих строк таблицы. В расчетных формулах используются данные xme, xmo из табл. 3.5, расположенной на другом рабочем листе (например ЛИСТ1), то для правильной адресации в расчетных формулах используются консолидированные ссылки. Формулы в ячейках для xme и xmo будут соответственно выглядеть так: в ячейке E22 – [=Лист1!В33+Лист1!G22*(Лист1!G17/2-D7)/C8], в ячейке E23 – [=ЛИСТ1!В32+ЛИСТ1!G22*(C7-C6)/(2*C7-C6-C8)].

2.2.1.3. Проверка гипотезы о нормальном распределении

интервального ряда

1. Исходными данными для проверки гипотезы являются интервальный ряд (табл.3.5, рис.2.1.) и статистические характеристики интервального ряда (табл.3.7, рис.2.6).

2. Для удобства вычислений составляется вспомогательная таблица (табл. 3.8), которую можно создать на новом рабочем листе (рис.2.7).

Значения колонок xSRi и fi копируются из табл.3.5 (команды: /Правка/копировать и /Правка/специальная вставка/значения).

3. При малых значениях частот (менее 3) рекомендуется объединять интервалы. При объединении интервалов частоты складываются и пересчитывается среднее значение переменной в объединенном интервале. В рассматриваемом примере это касается последнего и предпоследнего интервалов. Полученные при объединении средние значения интервалов и частоты представлены в колонках x'SRi и fi'. При объединении в ячейках D12 и E12 записываются следующие формулы [=(B12+B13)/2] и [=C12+C13].

4. Выполнить расчеты в колонках ti, fit, (fi'- fit)2/fit (2.13, 2.14, 2.15]. При расчете fit по формуле (2.13) предварительно в любой свободной ячейке (например в ячейке А2) рассчитаем промежуточную скалярную величину

. Формула в ячейке А2 будет иметь вид:

=Лист1!G22*Лист1!G17/Лист2!E21/КОРЕНЬ(2*ПИ())

После этого в ячейки F5, G5, H5 вводим следующие формулы:

в ячейке F5 - =[(D5-Лист1!$E$18)/Лист1!$E$21],

в ячейке G5 - =ОКРУГЛ($A$2*EXP(-0.5*F5^2);0),

в ячейке H5 - =[(E5-G5)^2/G5].

Пояснение: на Лист1 расположены параметры интервального ряда; на Лист2 – статистические характеристики интервального ряда. Теоретическая частота, рассчитываемая по формуле (2.15), является дробной величиной. Она округляется до ближайшего целого с помощью функции ОКРУГЛ().

5. Значение суммы в колонке

есть искомое значение критерия
Пирсона. Для вычисления суммы используется встроенная функция СУММ() или кнопка "Автосуммирования".

6. Для определения критического значения c2кр можно воспользоваться встроенной функцией ХИ2ОБР(a,m) при уровне значимости a=0,05 и числе степеней свободы m=k-2. Для данных примера расчетное значение c2p=19,964, критическое значение c2kr=12,592. Т.к. c2p>c2kr, то гипотеза о нормальном распределении отвергается.

2.2.1.4. Построение графиков

1. Исходными данными для построения графиков является интервальный ряд (табл.3.5 рис.2.1).

2. Выполнить команду /Вставка/Диаграмма/ либо нажать кнопку Мастера диаграмм. Это действие раскрывает диалоговое окно Мастер диаграмм. Мастер диаграмм представляет собой серию диалоговых окон для управления режимом построения диаграмм и установки параметров диаграмм. Построение диаграмм осуществляется по шагам - 4 шага. На каждом шаге раскрывается соответствующее диалоговое окно Мастера диаграмм. Диалоговые окна имеют несколько вкладок, которые открываются кнопками, расположенными в верхней части диалоговых окон. В нижней части окон Мастера диаграмм изображены кнопки Отмена, <Назад, Далее>, Готово. Кнопка Отмена прекращает построение диаграмм и закрывает окно Мастера диаграмм. Кнопка Далее> осуществляет переход к следующему шагу построения диаграмм. Кнопка <Назад позволяет вернуться к предыдущему шагу при необходимости исправить установки на предыдущих шагах. Окна имеют одно или несколько строк ввода для установки значений параметров диаграмм.

3. Окно шаг 1 из 4 Мастера диаграмм предлагает выбрать тип диаграммы. Excel имеет возможность выбора 14 различных типов стандартных диаграмм. Каждый тип в свою очередь имеет насколько форматов. Окно имеет две вкладки - стандартные и нестандартные. Открываем вкладку стандартные и выбираем следующие типы диаграмм: для гистограммы - "гистограмма", для полигона частот и кумулятивной кривой - "график".

4. Окно Шаг 2 из 4 Мастера диаграмм предлагает выбрать данные для построения диаграммы, положение данных в таблице (по строкам или столбцам), данные для разметки оси Х. Для выбора данных раскрываем вкладку Диапазон данных, активизируем строку ввода диапазон, открываем лист, содержащий интервальный ряд. Далее выделяем соответствующий блок ячеек: построение гистограммы и полигона частот осуществляется по данным колонки fi табл.3.5 рис.2.3, кумулятивная кривая строится по данным колонки si. Вкладка Ряды позволяет выбрать данные для разметки оси Х. Активизируем в ней строку ввода Подписи оси Х и в табл.3.5 выделяем данные для разметки оси Х: для гистограммы и кумулятивной кривой это будут данные столбца xi, для полигона - данные столбца xSRi.

5. Окно Шаг 3 из 4 Мастера диаграмм предлагает установить следующие параметры диаграмм: название диаграммы, названия оси Х и оси У, надписи на осях, установить координатную сетку или ее отменить, изменить размещение легенд. Открываем вкладку Заголовки и поочередно активизируя соответствующие строки ввода, вводим название диаграммы и название осей. Вкладка Оси позволяет установить или убрать разметку осей. Вкладка Подписи данных позволяет установить или убрать подписи значений данных на диаграмме. Вкладка Линии сетки позволяет изменить координатную сетку или убрать ее совсем. Вкладка Таблица данных позволяет поместить таблицу значений признака под диаграммой.

6. Окно Шаг 4 из 4 Мастера диаграмм предлагает поместить диаграмму на отдельном листе или на существующем. Выбираем на существующем. После этого нажать кнопку Готово.

7. При неудовлетворительном выборе параметров диаграмм и графиков можно выполнить редактирование соответствующих элементов (см.п.1.9).


8. Гистограмма, полигон частот и кумулятивная кривая изображены на рис.2.8.

3.2. Технология выполнения интервальной группировки в Statistica

Для выполнения группировки в системе Statistica из стартовой панели модуля Описательные статистики и таблицы выбирается процедура Таблицы частот По этой команде открывается одноименный диалог рис.3.1. Это окно содержит пять вкладок: Быстрый, Дополнительно, Опции, Описательные, Нормальность и кнопки управления: Переменные, Ок, Отмена, Опции.

Этот диалог предлагает множество настроек, позволяющие изменять вид и группировку в таблицах частот, проверять нормальность распределения, в том числе и графическим способом. Диалог в режиме вкладки Быстрый содержит несколько управляющих кнопок.

Кнопка Переменные открывает стандартное окно выбора списка переменных для анализа.

После нажатия этой кнопки ОК программа вычислит описательные статистики для всех выбранных переменных и разместит их в таблице.