Смекни!
smekni.com

Парадокси в математичній статистиці (стр. 7 из 22)

Де

- це умовна ймовірність події
за умов, що
набуло значення
дорівнює

. Тоді

(2.2.1 2)

І ймовірність того, що

дорівнює

. (2.2.1 3)

Байєс висунув ідею про те, що якщо ми не маємо ніякої попередньої інформації про

, апріорна щільність випадкової величини
рівномірна на усьому інтервалі
. Наприклад, якщо
,
,
,
, то за наведеною вище формулою (2.2.1 3), імовірність того, що
більше
, дорівнює
. Дійсно,

Не всі довіряють цьому результату, зокрема, тому, що мають сумніви щодо рівномірності апріорного розподілу.

Незнання апріорного розподілу виявилось настільки руйнівним для обґрунтування статистичних виводів з теореми Байєса, що ця теорема була майже виключена зі статистичних досліджень. Але в другій третині ХХ століття байєсівський підхід знову здобув розвитку, завдяки важливій ролі, яку він відіграє при пошуку допустимих та мінімаксних оцінок. Все більш розповсюджувалась точка зору про те, що послідовне застосування формули Байєса (коли після кожного експерименту апостеріорні ймовірності переоцінюють і на наступному кроці вони використовуються як апріорні імовірності) знижує роль вихідного апріорного розподілу, оскільки після багаторазового переоцінювання вихідний апріорний розподіл не впливає на заключний апостеріорний розподіл.

(Очевидно, що деякі випадки не розглядаються, наприклад, коли значення

дорівнює
, а апріорний розподіл рівномірний на відрізку
, що не містить точку
).

2.2.2 Парадокс

Нехай можливими значеннями випадкової величини

є цілі числа. Припустимо, що ймовірнісний розподіл
залежить від параметру
, який належить відрізку
. Якщо вибірка
здобута з невідомого розподілу
(розподілу з невідомим параметром
), то послідовність апостеріорних розподілів (які обчислені за вихідним апріорним розподілом)

.

концентрується навколо істинного значення невідомого параметра

.

Парадоксально, але це не завжди вірно. Наприклад, істинне значення параметра

може дорівнювати
, а послідовність апостеріорних розподілів (при збільшенні числа спостережень
) все більше зосереджується, наприклад, біля
.

2.2.3 Пояснення парадоксу

Парадоксальність ситуації полягає в тому, що очікується, що функція апостеріорної щільності буде набувати найбільше значення в околі істинного значення

, тобто поблизу
. Однак це міркування не суперечить тому, що функції апостеріорної щільності можуть усе більш зосереджуватись поблизу
. Якщо число можливих значень величини
скінченне, то такий випадок неможливий, але коли значеннями
можуть бути будь-які цілі числа, парадоксальна ситуація може відбутися.

Нехай апріорний розподіл параметра

рівномірний на відрізку
. Визначимо функцію
на цьому відрізку таким чином, що значеннями
завжди є натуральні числа, за виключенням точок
та
, де
. Нехай розподіл випадкової величини
(який залежить від
) має вигляд

,

де

є константою, для якої

.

При відповідному виборі

вказана вище парадоксальна ситуація здійснена. [5]

Найбільшого розповсюдження набули три точкові оцінки параметра

.

1. Мода. Оцінка

параметра
обирається виходячи з максимуму апостеріорної щільності, тобто

(2.2.3.1)

2. Медіана. Оцінка

параметра
обирається виходячи з рівності

,

або

3. Середнє. Оцінка

параметра
обирається як математичне сподівання

2.3 Парадокс методу найменших квадратів

2.3.1 Історія парадоксу

Через помилки вимірювань часто здається, що теоретичні формули й емпіричні дані суперечать одне одному. На початку минулого століття Лежандр, Гаус і Лаплас запропонували ефективний метод, що дозволяє зменшити вплив помилок вимірювань. Лежандр розробив і застосував цей метод у 1805 р. для знаходження орбіт комет. Початківцями цієї теорії були Галілей (1632), Ламберт (1760), Ейлер (1778) та інші. Новий метод, названий методом найменших квадратів, детально досліджував Гаус в своїй роботі “Теорія руху небесних тіл" (1809). Саме Гаус вказав на ймовірнісний характер цього методу. Хоча Лежандр і звинувачував Гауса в плагіаті, але він не міг пред’явити для цього достатні підстави. Гаус претендував на пріоритет лише у використанні методу, а не в його публікації. Лаплас опублікував свою основну роботу з теорії ймовірностей в 1812 р., присвятивши його “великому Наполеону”. Протягом всієї четвертої глави його роботи йде викладення числення похибок. З того часу метод найменших квадратів розвинувся в новий розділ математики.