Если мы хотим использовать это соотношение для практической проверки гипотезы о пуассоновском распределении выборки, надо заметить неизвестное значение λ его оценкой по выборке. Для больших выборок наилучшей является оценка наибольшего правдоподобия. Которая для пуассоновского распределения равна х. следовательно, надо проверить по выборке, выполняется ли соотношение:
(5.6)Если это неравенство не выполняется, гипотезу о том, что выборка извлечена из распределения Пуассона, следует отвергать на уровне значимости (примерно) 0.01. понятно, что при другом уровне значимости в правой части (5.5) будет стоять другая квантиль и поэтому правая часть (5.6) тоже будет другой.
Поскольку этот способ проверки приближенный, то чем большего объема окажется выборка в нашем распоряжении, тем точнее будет соблюден номинальный уровень значимости. К сожалению, трудно сказать определенно, начиная с каждого n результат такой проверки заслуживает доверия; по-видимому, для этого требуется не менее сотни наблюдений.
Подобным образом может быть проверено любое свойство теоретического распределения, если только мы располагаем достаточно большой выборкой. Главное здесь – выбор самого свойства. Эта характеристика распределения должна быть существенна для дальнейшего. Как правило, знания о типе распределения нужны для того, чтобы на их основе сделать по выборочным данным те или инее выводы. Нередко оказывается, что для справедливости этих выводов особенно важны лишь ее которые свойства теоретического закона распределения. Именно эти свойства и надо в первую очередь проверить.
РАЗДЕЛ II. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ КРИТЕРИЯ СОГЛАСИЯ
Все рассмотренные до сих пор критерии принято относить к группе так называемых параметрических критериев. Применение этих критериев требует знания типа распределения наблюдаемых случайных величин (нормальное, биномиальное, пуассоновское, двумерное нормальное или какое-либо иное) и проверяемая гипотеза касается параметров данных распределений. Прежде чем применять параметрические методы, необходимо убедиться в том, что мы действительно имеем дело с распределением требуемого типа.
Предположение о виде распределения случайной величины – это статистическая гипотеза, которую можно проверить с помощью экспериментальных данных. Критерии, позволяющие решать такого рода задачи, называются критериями согласия – согласия выборочных данных некоторому наперед заданному теоретическому распределению.
При проверке гипотезы о нормальности распределения с неизвестными средним и дисперсией критерий Колмогорова-Смирнова является более мощным, чем критерий .
При проведении данных исследований, в которых реализован ряд критериев проверки согласия эмпирического распределения с теоретической моделью: Пирсона, отношения правдоподобия, Колмогорова, Смирнова, и Мизеса, Никулина. Здесь и ниже, когда мы употребляем словосочетание “хорошее согласие”, то подразумеваем, что по всем критериям достигнутый уровень значимости, определяемый соотношением
где - значение статистики критерия, вычисленное по наблюдаемой выборке, - плотность предельного распределения статистики соответствующего критерия при справедливости гипотезы , был очень высок:
0,6-0,9
Например, на (Приложения рис.2) представлены результаты моделирования распределения статистики при вычислении оптимальных L-оценок [5] двух параметров нормального распределения при числе интервалов . На рисунке приведены построенная в результате моделирования эмпирическая функция распределения статистики , функция теоретического -распределения и значения достигнутого уровня значимости при проверке согласия по каждому из используемых критериев.
Если же оценки параметров искать по точечным выборкам (по исходным негруппированным наблюдениям), то предельные распределения статистики не являются -распределениями. Более того, распределения статистики становятся зависящими от того, как разбивается область определения случайной величины на интервалы [5]. Как выглядят распределения статистики при использовании ОМП по точечным выборкам по сравнению с -распределениями иллюстрирует (Приложения рис. 3), на котором приведены распределения при асимптотически оптимальном группировании (АОГ) и при разбиении на интервалы равной вероятности (РВГ) в случае проверки согласия с нормальным распределением с оцениванием двух его параметров и числе интервалов . При оценивании параметров нормального закона по группированной выборке статистика подчинялась бы в данном случае -распределению. Как подчеркивает (Приложения рис. 3), распределения статистики и очень существенно отличаются от -распределения. Игнорирование этого факта на практике часто приводит к неоправданному отклонению проверяемой гипотезы, к увеличению вероятности ошибок первого рода.
Зная предельные распределения и статистики , для любого заданного уровня значимости можно оценить мощность соответствующего критерия, рассматривая её как функцию от числа интервалов при заданном объеме выборки . Было проведено исследование мощности критериев Пирсона и Никулина как функции от и аналитически и методами статистического моделирования. Причем результаты аналитических вычислений оказались полностью подтвержденными оценками мощности, полученными на основании моделирования.
Величина мощности для критериев типа может быть вычислена в соответствии с выражением:
где - параметр нецентральности, представляет собой - процентную точку -распределения с степенями свободы ( - заданная вероятность ошибки первого рода, - вероятность ошибки второго рода). Все приводимые ниже функции мощности строились при уровне значимости .
На (Приложение рис. 4) в зависимости от числа интервалов при равновероятном и асимптотически оптимальном группировании для объема выборок , равного 500 и 5000, представлены функции мощности критерия Пирсона при проверке простой гипотезы о согласии с экспоненциальным законом ( : при ; против : при ). И в том, и в другом случае с ростом мощность падает, но в случае асимптотически оптимального группирования она выше, чем при равновероятном.