б) Выборка. Предположим, что в генеральной совокупности,
состоящей из N семей, Nk семей имеют ровно по k детей
(k = 0, 1 ...;
Nk = N). Если семья выбрана наугад, то число детей в ней является случайной величиной, которая принимает значение с вероятностью p =N /N. При выборе с возвращением можно рассматривать выборку объема n как совокупность n независимых случайных величин или «наблюдений» 1, ..., n, которые имеют все одно и то же распределение; Sn/n является средним значением выборки. Закон больших чисел утверждает, что для достаточно большой случайной выборки ее среднее значение будет, вероятно, близким к , т. е, к среднему значению генеральной совокупности. Центральная предельная теорема позволяет оценить вероятную величину расхождения между этими средними значениями и определить объем выборки, необходимый для надежной оценки. На практике и и обычно неизвестны; однако в большинстве случаев удается легко получить предварительную оценку для и всегда можно заключить в надежные границы. Если мы желаем, чтобы с вероятностью 0,99 или большей среднее значение выборки Sn/n отличалось от неизвестного среднего значения генеральной совокупности менее, чем на 1/10, то объем выборки должен быть взят таким, чтобы (1.4)Корень х уравнения Ф(х) — Ф(— х) = 0,99 равен х = 2,57 ..., и, следовательно, n должно быть таким, что
2,57 или n > 660 . Осторожная предварительная оценка дает возможность найти необходимый объем выборки.в) Распределение Пуассона.
Предположим, что случайные величины
k имеют распределение Пуассона {p(k; )}. Тогда Sn имеет распределение Пуассона с математическим ожиданием и дисперсией, равными n .Написав
вместо n , мы заключаем, что при nСуммирование производится по всем k от 0 до
. Ф-ла (1.5) имеет место и тогда, когда произвольным образом.Доказательство закона больших чисел
Проведем это доказательство в два этапа. Сначала предположим, что
существует, и заметим, что в этом случае D(S„) по теореме о дисперсии суммы. Согласно неравенству Чебышева, при любом t> 0 (2.1)При t>
nлевая часть меньше, чем , а последняя величина стремится к нулю. Это завершает первую часть доказательства.Отбросим теперь ограничительное условие существования D(
). Этот случай сводится к предшествующему методом усечения.Определим два новых набора случайных величин, зависящих от
, следующим образом:Uk=
, Vk=0, если (2.2)Uk=0, Vk=
, еслиЗдесь k=1,… , п и
фиксировано. Тогда =Uk+Vk(2.3)при всех k.
Пусть {f(
j)} — распределение вероятностей случайных величин (одинаковое для всех j). Мы предположили, что = M( ) существует, так что сумма (2.4)конечна. Тогда существует и
(2.5)где суммирование производится по всем тем j, при которых
. Отметим, что хотя и зависит от п, но оно одинаково дляU1, U2,..., Un. Кроме того,
при , и, следовательно, для произвольного > 0 и всех достаточно больших n .(2.6)Далее, из (2.5) и (2,4) следует, что
(2.7)Ukвзаимно независимы, и с их суммой U1+U2+…+Unможно поступить точно так же, как и с Xkв случае конечной дисперсии, применив неравенство Чебышева, мы получим аналогично (2.1)
Вследствие (2.6) отсюда вытекает, что
(2.9)Далее заметим, что с большой вероятностью Vk= 0. Действительно,
(2.10)Поскольку ряд (2.4) сходится, последняя сумма стремится к нулю при возрастании n. Таким образом, при достаточно большом п
P{Vk
0} (2.11)и следовательно
P{V1+…+Vn
0} . (2.12)Но
, и из (2.9) и (2.12) получаем (2.13)Так как
и произвольны, правая часть может быть сделана сколь угодно малой, что и завершает доказательство.Теория «безобидных» игр
При дальнейшем анализе сущности закона больших чисел будем пользоваться традиционной терминологией игроков, хотя наши рассмотрения допускают в равной степени иболее серьезные приложения, а два наших основных предположения более реальны в статистике и физике, чем в азартных играх. Во-первых, предположим, что игрок обладает неограниченным капиталом, так что никакой проигрыш не может вызвать окончания игры. (Отбрасывание этого предположения приводит к задаче о разорении игрока, которая всегда интригует изучающих теорию вероятностей.) Во-вторых, предположим, что игрок не имеет нрава прервать игру, когда ему заблагорассудится: число п испытаний должно быть фиксировано заранее и не должно зависеть от хода игры. Иначе игрок, осчастливленный неограниченным капиталом, дождался бы серии удач и в подходящий момент прекратил бы игру. Такого игрока интересует не вероятное колебание в заданный момент, а максимальные колебания в длинной серии партий, которые описываются скорее законом повторного логарифма, чем законом больших чисел .