Смекни!
smekni.com

Исследование алгоритма SSA-метода при анализе временных последовательностей данных с шумом по известному (стр. 3 из 8)

Эксцесс

р-квантиль

2.4 Получение выборки с распределением Rayleigh

Генерирование случайных чисел

x

=

Текст программы на C++

#include<stdio.h>

#include<stdlib.h>

#include<conio.h>

#include<time.h>

#include<math.h>

int main()

{FILE *f;

int i;

const int a=1;

float m[43];

if((f=fopen("43.txt","wb"))==NULL)

{printf("!!Cann't write file!!&bsol;n");exit(1);}

else printf("Can write file 43.txt&bsol;n");

printf("&bsol;n");

srand(time(NULL));

for(i=0;i<43;i++)

{

m[i]=a*sqrt( (-2)*log(float(rand())/RAND_MAX) );

printf("%f &bsol;n",m[i]);

fprintf(f,"%f &bsol;n",m[i]);

}

fclose(f);

return 0;}

Полученный по этой функции ряд представлен следующими значениями:

1.844905 2.870072 1.764507 1.110845 1.526675 0.788239 0.816683 1.968559 0.525110 0.797883 1.464174 1.080738 1.356594 0.425269 1.633723 3.143837 1.242856 1.467282 1.063998 2.868115 0.975500 1.288683 1.921442 0.605059 0.716165 2.192975 2.094303 1.237865 0.902787 1.665678 1.110946 1.694965 0.569614 1.908184 1.234843 1.612594 0.508507 0.355821 0.721552 0.678204 0.108697 1.029705 0.827769

Объем выборки равен 43. Это ограничение обусловлено последующим использованием пакета Mathcad, в котором общее число элементов матрицы не должно превышать числа 600.

2.5 Формулировка гипотезы о законе распределения Rayleigh

Пусть f0(x) – известная плотность вероятности распределения Rayleigh и fξ(x) – плотность вероятности генеральной совокупности.

Гипотеза вида

{H0 : fξ(x) = f0(x); H1 : fξ(x) ≠ f0(x);}

Является двухальтернативной непараметрической сложной гипотезой о законе распределения. Здесь проверяется утверждение о том, что исследуемая выборка извлечена из распределения f0(x)

Для проверки согласия полученных случайных величин теоретическому распределению используется λ-критерий Колмогорова–Смирнова. Критерий Колмогорова–Смирнова применяется с наибольшей эффективностью, когда есть основание предположить, что частоты каждого из порядковых значений будут располагаться не случайным образом, а в соответствии с некоторой предсказуемой схемой.

Процедура, связанная с вычислением тестовой статистики λ, требует накапливания частот по всем порядковым значениям. Затем сравниваются два распределения накопленных частот – теоретическое распределение, имеющее место при справедливой H0, и наблюдаемое распределение. Таким образом, проверяется гипотеза

H0 : Fξ(x) = F0(x),

против альтернативы


H1 : Fξ(x) ≠ F0(x),

где Fξ(x) – функция распределения генеральной совокупности, F0(x) – непрерывная гипотетическая функция распределения.

Для проверки гипотезы используется статистика

,

где Δ – максимальный модуль отклонения гипотетической функции распределения от эмпирической функции распределения

.

Если гипотеза H0 верна, то статистика λ имеет распределение, приближающееся при

к распределению Колмогорова–Смирнова. Критерий для проверки гипотезы имеет следующий вид:

P(λ > λα) = α,

где α – 100α-процентное отклонение распределения Колмогорова–Смирнова. Например, для α = 0,01 критическое значение статистики λα = 1,627.

Для последовательности (выборки) данные сгруппированы для проведения расчетов по критерию согласия Колмогорова–Смирнова.

Г. Стерджес (Herbert Sturges, 1926) предложил правило для определения числа интервалов k при построении гистограммы распределения случайной величины. При этом i-й интервал является биномиальным коэффициентом

. Общий объем выборки

,

отсюда число интервалов для построения гистограммы с нормальными данными

,

где n – количество значений случайной величины в исследуемой выборке. Полученное значение округляется до целого числа. Правило Г. Стерджеса справедливо для величин, распределенных по нормальному закону. В общем случае оно может быть использовано без корректировки для n < 200. При использовании десятичного логарифма, соответственно, используется формула

.

Для построения гистограммы и проверки гипотезы о законе распределения Rayleigh построена таблица 2.

Таблица 2 – Исходные данные для построения гистограммы и проверки гипотезы о законе распределения Rayleigh

1 2 3 4 5 6 7
ξi 0-0.448 0.448-0.896 0.896-1.344 1.344-1.792 1.792-2.24 2.24-2.688 2.688-3.14
Fξ 3 11 11 9 6 0 3

2.6 Проверка гипотезы о законе распределения Rayleigh

Для проверки гипотезы о законе распределения выполняется следующая последовательность шагов.

Шаг 1. Находим ожидаемую частоту ni0 путем вычисления в Mathcad интеграла функции плотности вероятности на каждом из интервалов. Результат представлен на рисунках 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8.

Рисунок 2.2. Ожидаемая вероятность на интервале 0 - 0,448

Рисунок 2.3. Ожидаемая вероятность на интервале 0,448-0,896

Рисунок 2.4. Ожидаемая вероятность на интервале 0,896-1,344


Рисунок 2.5. Ожидаемая вероятность на интервале 1,344-1,792

Рисунок 2.6. Ожидаемая вероятность на интервале 1,792-2,240

Рисунок 2.7. Ожидаемая вероятность на интервале 2,240-2,688

Рисунок 2.8. Ожидаемая вероятность на интервале 2,688 - 3.14


Шаг 2. Выражаем каждую наблюдаемую и каждую ожидаемую частоту в виде отношения:

частота клетки

n

Шаг 3. Вычисляем накопленные значения наблюдаемых и ожидаемых отношений путем их суммирования слева направо (суммирование справа налево также приводит к статистике λ).

Шаг 4. Находим абсолютные значения разности между накопленными наблюдаемыми отношениями и накопленными ожидаемыми отношениями.

Шаг 5. Находим наибольшее отношение и выражаем его в виде десятичной дроби. Полученное значение соответствует тестовой статистике λ. В данном примере наибольшее отношение равно Δ =0,04226744.

Шаг 6. В таблице Е [4, с. 141] (критические значения Δα в критерии Колмогорова–Смирнова для одной выборки) при объеме выборки свыше 35 предлагается определять критическое значение Δα при α = 0,01 по формуле

.

Если наблюдаемое значение Δ больше или равно критическому значению, H0 отклоняется. В данном примере критическое значение Δα=0,249. Поскольку наблюдаемое значение Δ меньше критического, H0 принимается.

2.7 Программа для проверки гипотезы о законе распределения

Проверка гипотезы о законе распределения выполнена в электронной таблице MS Excel. Случайные величины эмпирического распределения расположены в ячейках B2:B44. Рабочее поле для выполнения расчетов расположено в ячейках E4:K11.


Рисунок 2.9. Проверка гипотезы о законе распределения, выполненная в электронной таблице MS Excel


3. SSA-метод

3.1 Определение собственных чисел матрицы

Предположим, что

и
. Вектор
принадлежит
и будет элементом из области значений матрицы А. Нам будут особенно интересны те векторы x, которые при умножении на А переходят в кратные им векторы, т.е. такие векторы
, для которых существует число
из
с
. Такой ненулевой вектор
называется правым собственным вектором матрицы
и
– соответствующим собственным значением.

Написанное выше уравнение может быть переписано в виде

.