Смекни!
smekni.com

Применение MS Excel для решения статистических задач (стр. 3 из 6)

2. Выберите из списка "Инструменты анализа" пункт "Описательная статистика" и нажмите кнопку "ОК". Результатом будет появление окна диалога инструмента "Описательная статистика".

3. Заполните поля диалогового окна, как показано на рис. 4 и нажмите кнопку "ОК".

Результатом выполнения указанных действий будет формирование отдельного листа, содержащего вычисленные характеристики описательной статистики для исследуемых переменных. Выполнив операции форматирования, можно привести полученную ЭТ к более наглядному виду (рис.5).

Рис.4 . Заполнение полей диалогового окна "Описательная статистика"

Рис.5. Описательная статистика для исследуемых переменных

Вторая строка ЭТ содержит значения стандартных ошибок

для средних величин распределений. Другими словами среднее или ожидаемое значение случайной величины М (Е) определено с погрешностью
.
[1]

Медиана - это значение случайной величины, которое делит площадь, ограниченную кривой распределения, пополам (т.е. середина численного ряда или интервала). Как и математическое ожидание, медиана является одной из характеристик центра распределения случайной величины. В симметричных распределениях значение медианы должно быть равным или достаточно близким к математическому ожиданию.

Мода - наиболее вероятное значение случайной величины (наиболее часто встречающееся значение в интервале данных). Для симметричных распределений мода равна математическому ожиданию. Иногда мода может отсутствовать. В данном случае ППП EXCEL вернул сообщение об ошибке. Таким образом, вычисление моды не представляется возможным.

Эксцессхарактеризует остроконечность (положительное значение) или пологость (отрицательное значение) распределения по сравнению с нормальной кривой. Теоретически, эксцесс нормального распределения должен быть равен 0. Однако на практике для генеральных совокупностей больших объемов его малыми значениями можно пренебречь. [2]

Асимметричность (коэффициент асимметрии или скоса - s) характеризует смещение распределения относительно математического ожидания. При положительном значении коэффициента распределение скошено вправо, т.е. его более длинная часть лежит правее центра (математического ожидания) и обратно. Для нормального распределения коэффициент асимметрии равен 0. На практике, его малыми значениями можно пренебречь.

Для вычисления коэффициента асимметрии используется статистическая функция СКОС (). Формула для проверки значимости показателя эксцесса задается аналогичным образом. Числителем этой формулы будет функция ЭКСЦЕСС (), а знаменателем соотношение, реализованное средствами ППП EXCEL.

Оставшиеся показатели описательной статистики представляют меньший интерес. Величина "Интервал"определяется как разность между максимальным и минимальным значением случайной величины (численного ряда). Параметры "Счет"и "Сумма"представляют собой число значений в заданном интервале и их сумму соответственно. [3]

Последняя характеристика "Уровень надежности" показывает величину доверительного интервала для математического ожидания согласно заданному уровню надежности или доверия.По умолчанию уровень надежности принят равным 95%.

1.4. Анализ данных

Дополнение "Анализ данных" содержит целый ряд других полезных инструментов, позволяющих быстро и эффективно осуществить требуемый вид обработки данных. Вместе с тем, большинство из них требует осмысленного применения и соответствующей подготовки пользователя в области математической статистики.

Это средство анализа служит для создания одномерного статистического отчета, содержащего информацию о центральной тенденции и изменчивости входных данных.

Экспоненциальное сглаживание

Предназначается для предсказания значения на основе прогноза для предыдущего периода, скорректированного с учетом погрешностей в этом прогнозе. Использует константу сглаживания a, по величине которой определяет, насколько сильно влияют на прогнозы погрешности в предыдущем прогнозе. [4]

Анализ Фурье

Предназначается для решения задач в линейных системах и анализа периодических данных, используя метод быстрого преобразования Фурье (БПФ). Эта процедура поддерживает также обратные преобразования, при этом, инвертирование преобразованных данных возвращает исходные данные.

Двухвыборочный F-тест для дисперсий

Двухвыборочный F-тест применяется для сравнения дисперсий двух генеральных совокупностей. Например, F-тест можно использовать для выявления различия в дисперсиях временных характеристик, вычисленных по двум выборкам.

Гистограмма

Используется для вычисления выборочных и интегральных частот попадания данных в указанные интервалы значений, при этом, генерируются числа попаданий для заданного диапазона ячеек.

Скользящее среднее

Используется для расчета значений в прогнозируемом периоде на основе среднего значения переменной для указанного числа предшествующих периодов. Каждое прогнозируемое значение основано на формуле:

где

N число предшествующих периодов, входящих в скользящее среднее

Aj фактическое значение в момент времени j

Fj прогнозируемое значение в момент времени j

Скользящее среднее, в отличие от простого среднего для всей выборки, содержит сведения о тенденциях изменения данных. Процедура может использоваться для прогноза сбыта, инвентаризации и других процессов.

Проведение t-теста

Пакет анализа включает в себя три средства анализа среднего для совокупностей различных типов:

Двухвыборочный t-тест с одинаковыми дисперсиями

Двухвыборочный t-тест Стьюдента служит для проверки гипотезы о равенстве средних для двух выборок. Эта форма t-теста предполагает совпадение дисперсий генеральных совокупностей и обычно называется гомоскедастическим t-тестом.

Двухвыборочный t-тест с разными дисперсиями

Двухвыборочный t-тест Стьюдента используется для проверки гипотезы о равенстве средних для двух выборок данных из разных генеральных совокупностей. Эта форма t-теста предполагает несовпадение дисперсий генеральных совокупностей и обычно называется гетероскедастическим t-тестом.

Парный двухвыборочный t-тест для средних

Парный двухвыборочный t-тест Стьюдента используется для проверки гипотезы о различии средних для двух выборок данных. В нем не предполагается равенство дисперсийгенеральныхсовокупностей, из которых выбраны данные. Парный тест используется, когда имеется естественная парность наблюдений в выборках, например, когда генеральная совокупность тестируется дважды. [7]

Генерация случайных чисел

Используется для заполнения диапазона случайными числами, извлеченными из одного или нескольких распределений. С помощью данной процедуры можно моделировать объекты, имеющие случайную природу, по известному распределению вероятностей.

Ранг и персентиль

Используется для вывода таблицы, содержащей порядковый и процентный ранги для каждого значения в наборе данных. Данная процедура может быть применена для анализа относительного взаиморасположения данных в наборе. Рассмотрим пример применения данной функции.

Требуется с помощью коэффициента Спирмена определить зависимость между величиной уставного капитала предприятий Х и количеством выставленных акций Y. Данные о предприятиях города, выставивших акции на чековый аукцион, приведены ниже в таблице 1.

Таблица1

B C D
21 Номер предприятия Уставный капитал, млн. руб. Х Число выставленных акций Y

Продолжение таблицы 1

22 1 2954 856
23 2 1605 930
24 3 4102 1563
25 4 2350 682
26 5 2625 616
27 6 1795 495
28 7 2813 815
29 8 1751 858
30 9 1700 467
31 10 2264 661

Для решения задачи используем режим работы «Ранг и персентиль». Результаты выполнения данного режима приведены ниже в таблице.

B C D E F G H I
35 Точка Столбец1 Ранг Процент Точка Столбец1 Ранг Процент
36 3 4102 1 100,00 3 1563 1 100,00
37 1 2954 2 88,80 2 930 2 88,80
38 7 2813 3 77,70 8 858 3 77,70
39 5 2625 4 66,60 1 856 4 66,60
40 4 2350 5 55,50 7 815 5 55,50
41 10 2264 6 44,40 4 682 6 44,40
42 6 1795 7 33,30 10 661 7 33,30
43 8 1751 8 22,20 5 616 8 22,20
44 9 1700 9 11,10 6 495 9 11,10
45 2 1605 10 11,10 9 467 10 11,10

По данным этой сгенерированной таблицы заполняем в следующей таблице графы Ранг

и Ранг
, на основании которых производим вычисления квадратов разности рангов
.