Теперь необходимо провести оценку существенности разности двух выборочных средних. Если разность между средними величинами статистически значима, это означает, что различие вызвано неслучайными факторами, или выборки не принадлежат одной генеральной совокупности. Иначе эта задача формулируется как проверка статистической гипотезы о равенстве двух средних:
.В лабораторной работе содержательно гипотеза формулируется следующим образом: взяты выборки из одной или из разных генеральных совокупностей? В контексте решаемой задачи ответ очевиден – выборки взяты из одной и той же совокупности. Но следует обратить особое внимание на проявление эффекта случайной ошибки репрезентативности. Реализация процедуры проверки гипотезы может дать, в редких случаях, парадоксальный результат, а именно, показать на основе t‑критерия, что выборки как бы взяты из разных генеральных совокупностей с разными значениями средних величин. С дидактической точки зрения такой результат весьма полезен для понимания существа статистических выводов и степени их условности. Для демонстрации этого эффекта рекомендуется взять такие две выборки, из ранее полученных, для которых разность между средними выборочными значениями максимальна [3].
В данной работе для сравнения взяты выборки, объёмом 70 и 25 единиц. Результаты анализа занесены в таблицу ниже.
Таблица 3.1. Результаты расчёта t-критерия для выборок, объёмом 70 и 25 единиц
В полученной таблице рассчитаны следующие показатели:
- Mean – среднее значение по двум выборкам.
- t-value – t‑критерий, необходимый для оценки существенности разности двух средних:
, т. к. , то .- df – число степеней свободы.
- p – расчётный уровень значимости t‑критерия.
- t-separ– расчетное значение t‑критерия с учетом различных дисперсий. Очевидно, что в этом примере оно не изменяется, однако программа выдаёт другой результат.
- df – число степеней свободы t‑критерия при условии неравных дисперсий.
. Расчетное значение mокругляется до целого значения в силу того, что число степеней свободы есть целое число по определению.- p– расчетный уровень значимости t‑критерия при условии неизвестных и неравных дисперсий.
- ValidN – объём каждой выборки.
- Std. Dev. – среднее квадратическое отклонение:
- F-ratio– F‑критерий (дисперсионное отношение), используемый для оценки существенности различия значений двух дисперсий:
.- p –расчетный уровень значимости P‑критерия.
Гипотеза принимается, если
. Здесь . Табличное значение t‑критерия равно . Таким образом , следовательно, испытуемая гипотеза принимается. Аналогичный вывод можно получить на основе сравнения расчетного и принятого уровней значимости: .Для наглядного и компактного представления результатов проведенного выборочного наблюдения необходимо воспользоваться графическими возможностями ППП STATISTICA. Весьма существенным, с дидактической точки зрения, является то, что последовательное выполнение рассматриваемых лабораторных работ, дает возможность наглядного сравнения результатов выборочного и сплошного наблюдений. Вполне очевидно, что, по определению, такое сравнение исключено в реальных практических условиях [3].
Рисунок 4.1. Графическое сравнение результатов сплошного и выборочного наблюдения
График наглядно показывает, что доверительные интервалы, построенные по всем выборкам, накрывают генеральную среднюю, что естественно. Если бы, какой либо доверительный интервал, рассчитанный по результатам выборки, не включал в себя значение генеральной средней, то в реальных условиях, это означало бы получение ошибочного вывода на основе выборки.
Диаграмма наглядно демонстрирует возможный результат выборочного зондирования исследуемой генеральной совокупности и убедительно иллюстрирует объективную неоднозначность выводов, формулируемых на основе выборочных данных.
Среднее значение выборки, состоящей из 70 единиц, равно 53,64286, оно отличается от генеральной средней на 2,06309, величина среднеквадратического отклонения равна 16,66183. Средняя ошибка этой выборки – 1,991470, а интервал оптимальности
, т.е. с вероятностью 95% можно утверждать, что в среднем по России число собственных легковых автомобилей на 1000 человек населения в 1990 году находилось в указанных пределах. Расчётное значение t-критерия составляет -1,03596, меньше 2, следовательно, различия между генеральной и выборочной средней случайны, и выборочное среднее является достоверной оценкой генеральной средней. Расчётный уровень значимости t-критерия также подтверждает это ( ).По результатам проверки гипотезы о равенстве двух выборочных средних получены следующие выводы: расчётное значение t-критерия меньше табличного, следовательно, с вероятностью 95% можно утверждать, что две выборочных средних равны и получены не случайным образом (это подтверждает и расчётный уровень значимости, больший 0,05).
График наглядно показывает, что доверительные интервалы, построенные по всем выборкам, накрывают генеральную среднюю, что естественно. Если бы, какой либо доверительный интервал, рассчитанный по результатам выборки, не включал в себя значение генеральной средней, то в реальных условиях, это означало бы получение ошибочного вывода на основе выборки.
1. Лекции по дисциплине статистика. Лектор – доц. О.А. Пономарёва, 2008.
2. Сборник Росстата Регионы России. Социально-экономические показатели. 2006.
3. Учебное пособие. Статистика. Методы анализа распределений. Выборочное наблюдение. Н.В. Куприенко, О.А. Пономарёва, Д.В. Тихонов. 132 с. – 2008.