Статистическое исследование свойств псевдослучайных чисел получаемых методом Джона фон Неймана (стр. 2 из 3)

а б

рис. 1.1

Теорема. Функция распределения случайной величины Х, распределенной по равномерному закону, есть

F(x)=

ее математическое ожидание

M(X) =

(1.3)

а дисперсия

D(X) =

(1.4)

Равномерный закон распределения используется при анализе ошибок округления при проведении числовых расчетов, в ряде задач массового обслуживания, при статистическом моделировании наблюдений, подчиненных заданному распределению. Так, случайная величина Х, распределенная по равномерному закону на отрезке [0,1], называемая «случайным числом от 0 до 1», служит материалом для получения случайных величин с любым законом распределения.

Понятие о критериях согласия

Полного совпадения между теоретическими и эмпирическими частотами нет. Более того, иногда между опытными и теоретическими частотами наблюдаются значительные расхождения. Например, если исходить из того, что рост мужчины имеет нормальное распределение, то из 1000 мужчин 173 должны иметь рост от 161 до 164 см. В действительности их оказалось 181. Если предположить, что число распадающихся за 1/8 мин атомов радиоактивного вещества следует по закону Пуассона, то из 2608 промежутков должно быть 407 таких, в которых распадается по 2 атома. На самом деле их было 383. Разница составляет 24 промежутка и кажется значительной. Эти расхождения можно объяснить двояко:

1. Несовпадения между опытными и теоретическими частотами несущественны, они объясняются случайностью отбора отдельных элементов или результатов единичных наблюдений. Допущение о распределении изучаемого признака по закону, выбранному в качестве предполагаемого теоретического, должно быть признано не противоречащим имеющимся опытным данным, согласованным с ними.

2. Различия между теоретическими и наблюденными частотами объяснить случайностью нельзя, опытное и теоретическое распределения противоречат друг другу. Допущение о распределении изучаемого признака по избранному закону необходимо признать ошибочным.

Но что позволит сделать первый или второй вывод? Эту возможность дают критерии согласия.

Можно рассмотреть различные виды расхождений между теоретическим и опытным распределениями. Каждый вид такого расхождения является случайной величиной. Иногда удается установить ее закон распределения. Зная его, можно сформулировать предложение (правило), устанавливающее когда полученное в действительности расхождение между предполагаемым теоретическим и опытным распределениями следует признать несущественным, случайным, а когда существенным, неслучайным. Это предложение и будет критерием согласия.

Итак, предположим, что неизвестен закон распределения случайной величины Х, которая характеризует некоторый вид или функцию расхождений между предполагаемым теоретическим и опытным распределениями. С другой стороны, имея опытное распределение признака, можно найти значение α, которое в рассматриваемом случае приняла случайная величина Х.

Закон распределения случайной величины Х определяет вероятность того, что она примет какое-нибудь значение, не меньшее α. Пусть эта вероятность Р(Х≥α)=β. Согласно принципу практической уверенности при однократном наблюдении происходит немаловероятное событие. Поэтому если величина α была получена как результат наблюдения именно случайной величины Х, т.е. при распределении рассматриваемого признака по предполагаемому теоретическому закону, то вероятность β не должна быть малой. Если же вероятность β оказалась весьма малой, то это означает, что наступило маловероятное событие, которое в соответствии с тем же принципом практической уверенности при распределении признака в генеральной совокупности по предложенному закону не должно было наступить. Наступление события с такой вероятностью объясняется, по-видимому, тем, что наблюдалась случайная величина, распределенная не по предположенному закону, а по какому-то другому. Таким образом, в случае, когда вероятность β не мала, расхождения между эмпирическим и теоретическим распределениями следует признать несущественными, случайными, а опытное и теоретическое распределения – не противоречащими, согласующимися друг с другом. Если же вероятность β мала, то расхождения между опытным и теоретическим распределениями существенны, объяснить их случайностью нельзя, а гипотезу о распределении признака по предложенному теоретическому закону следует считать не подтвердившейся, она не согласуется с опытными данными. По-видимому, при выборе предполагаемого теоретического закона не были в достаточной степени учтены особенности имеющихся опытных данных или при этом сказались субъективные качества исследователя. Следует внимательнее изучить опытные данные и попытаться найти новый теоретический закон в качестве предполагаемого для рассматриваемого признака, который лучше, полнее учитывал бы особенности опытного распределения.

Необходимо только установить, какие вероятности считаются «малыми». Обычно это вероятности, не превосходящие 0,01. В других случаях считают малыми вероятности, не превосходящие 0,05.

Существует много критериев согласия. Рассмотрим критерий χ-квадрат (Пирсона) и критерий Колмогорова.

Критерий согласия

(Пирсона)

Пусть в результате n наблюдений получен вариационный ряд с опытными частотами n1, n2, …, nm. Тогда сумма их n1+n2+..+nm=n. Анализ опытных данных привел, допустим, к выбору некоторого теоретического закона распределения в качестве предполагаемого для рассматриваемого признака, а по опытным данным найдены его параметры (если они не были известны заранее). С помощью самого закона вычислены теоретические частоты n01, n02, …,n0m, соответствующие эмпирическим частотам. Сумма теоретических частот также равна объему совокупности n:

n01+ n02+…+n0m=n.

В качестве меры расхождения теоретического и эмпирического рядов частот можно взять величину

Из этого выражения видно, что χ2 равно нулю лишь при совпадении всех соответствующих эмпирических и теоретических частот: ni =n0i (i = 1, 2, …, m). В противном случае χ2 отлично от нуля и тем больше, чем больше расхождения между указанными частотами.

Величина χ2 , определяемая равенством, является случайной, которая как можно показать, имеет χ2-распределение, где k – число степеней свободы. Число k = m – s, где m – число групп эмпирического распределения, а s – число параметров теоретического закона, найденных с помощью этого распределения, вместе с числом дополнительных соотношений, которым подчинены эмпирические частоты. Если же эмпирическое распределение не использовалось для нахождения параметров теоретического закона и теоретических частот, а эмпирические частоты не связаны никакими дополнительными соотношениями, то k равно числу групп эмпирического распределения, причем в обоих случаях наблюденные частоты должны быть не малы. Малые частоты следует объединить с соседними с тем, чтобы укрупнить группы. Это будет показано на приводимом ниже примере.

Таким образом, схема расчета критерия согласия χ2 следующая:

По опытным данным выбрать в качестве предполагаемого закон распределения изучаемого признака и найти его параметры.

Определить теоретические частоты с помощью полученного закона распределения. Если среди опытных частот имеются малочисленные, объединить их с соседними.

По формуле (1) вычислить величину χ2. Пусть она оказалась равной χ20.

Определить число степеней свободы k.

В приложении 4 по полученным значениям χ2 и k найти вероятность β того, что случайная величина, имеющая χ2-распределение, примет какое-нибудь значение, не меньшее χ20 : P(χ2

χ20) =

Сформулировать вывод, руководствуясь общим принципом применения критериев согласия, а именно: если вероятность β больше 0.01, то имеющиеся расхождения между теоретическими и опытными частотами следует считать несущественными, а опытное распределение – согласующимся с теоретическим. В противном случае (β<0.01) указанные расхождения признаются неслучайными, а закон распределения, избранный в качестве предполагаемого теоретического, отвергается.

Критерий Колмогорова

На практике кроме критерия χ2 часто используется критерий Колмогорова, в котором в качестве меры расхождения между теоретическими и эмпирическими распределениями рассматривают максимальное значение абсолютной величины разности между эмпирической функцией распределения

и соответствующей теоретической функцией распределения

называемое статистикой критерия Колмогорова.

Доказано, что какова бы ни была функция распределения F(x) непрерывной случайной величины X, при неограниченном увеличении числа наблюдений (n

) вероятность неравенства P(D

) стремится к пределу

задавая уровень значимости α, из соотношения

можно найти соответствующее критическое значение