
(1.3.1)
Випадок

й (або)

не виключається.
Теорема 1.2.1. Випадкова величина

, яка задовольняє рівнянню

(1.3.2)
має щільність розподілу

.
Доведення. Оскільки функція

строго зростає в інтервалі

від

до

, тоді рівняння (1.3.2) має єдиний корень при кожному

. При цьому

(1.3.3)
Випадкова величина

рівномірно розподілена в інтервалі

, тому

(1.3.4)
Отже,

(1.3.5)
Що і треба було довести.
1.4 Критерій Смірнова
Постановка задачі. Нехай

та

– реалізації вибірок

та

з неперервних розподілів

і

відповідно. Відносно невідомих розподілів

і

висувається гіпотеза

.(1.4.1)
Необхідно перевірити гіпотезу

.
Відхилення

між емпіричними функціями розподілу

та

. Смірнов за відхилення між емпіричними функціями розподілу

та

запропонував розглядати величину

.(1.4.2)
Так введене відхилення задовольняє умовам, які забезпечують побудову критерію: 1) при справедливій гіпотезі

відхилення

мінімально можливе в порівнянні зі значеннями

, коли

, оскільки

– незміщена та спроможна оцінка для

,

– незміщена та спроможна оцінка для

;
2) при достатньо великих

розподіл

(1.4.3)
мінімально можливого відхилення мало відрізняється від розподілу Колмогорова. Отже, за цей розподіл можна розглядати розподіл Колмогорова. Останнє випливає з теореми.
Теорема Смірнова. Нехай

та

незалежні вибірки з неперервних розподілів

і

;

та

– емпіричні функції розподілів побудовані за вибірками

та

.
Якщо

, тоді при

так, що відношення

має границю, справедливо

,(1.4.4)
де

– функція розподілу Колмогорова.
Далі, обчислюємо відхилення (1.4.2) і порівнюємо його з мінімально можливим відхиленням

. При цьому,

порівнюємо з

не безпосередньо (оскільки

– випадкова величина), а порівнюємо з числом

, що відокремлює малі значення

від великих.
Критерій Смірнова. Нехай

та

– незалежні вибірки з неперервних розподілів

і

відповідно.

– верхня

– границя розподілу Колмогорова. Якщо

,(1.4.5)
то гіпотезу

відхиляють, і не відхиляють в супротивному разі.
Рівень значущості критерію –

.
Зауваження 1.

– верхня

– границя розподілу Колмогорова визначається як розв’язок рівняння

.(1.4.6)

.
2. Сучасні методи оцінювання розподілу малої вибірки
2.1 Метод прямокутних внесків (МПВ)
Метод прямокутних внесків був запропонований Чавчанідзе В.В. та Кумсішвілі В.А. в 1959 році [4]. Цей метод спрямований на побудову оцінки щільності розподілу f*(x).
Основні припущення метода такі. Множина можливих значень випадкових величин

– відрізок [a,b]. Кожна випадкова величина використовується для побудови оцінки щільності окремо, при цьому кожна випадкова величина рівномірно "розмазується" в прямокутнику

.
За додаткову апріорну інформацію передбачається знання інтервалу [а;b], в якому випадкова величина

набуває значень. При цьому вважається, що щільність розподілу f(x) неперервна, не має дуже великих стрибків на заданому інтервалі й
f(x)≥0 при а≤x≤b;(2.1.1)
f(x)≡0 при x<a, x>b.(2.1.2)
Наявність подібної апріорної інформації, навіть за відсутності реалізацій

вибірки

, дозволяє побудувати оцінку щільності f*(x). Жодній з можливих реалізацій

всередині інтервалу [а;b] не можна віддати перевагу. Саме таку особливість має рівномірний розподіл на [а;b] (див. рис 2.1.1)