Для полученных процессов дисперсия находится по следующим формулам (3.7-3.8):
, (3.7) (3.8)Для того чтобы учесть статистическую связь между значениями функции при различных значениях аргумента, кроме математического ожидания и дисперсии, анализируются корреляционные моменты между значениями случайного процесса в различные моменты времени. Корреляционный момент между двумя значениями функции в определённые моменты времени определяет корреляционную функцию случайного процесса. В программе корреляционный момент вычисляется по формуле (3.9):
(3.9)Случайные процессы называются некоррелированными, если KOR=0 при любых значениях аргументов. В противоположном случае случайные процессы являются коррелированными.
Удобно пользоваться нормированной корреляционной функцией (коэффициентом корреляции), которая является безразмерной функцией и определяется следующим образом (3.10):
, (3.10)где KOR – взаимный корреляционный момент
DX, DY – дисперсии переменных состояния (определены выше).
3.2 Проверка гипотезы о независимости случайных величин при уровне значимости a в момент времени
Для проверки гипотезы о независимости двух случайных величин по выборке XX и YY, весь диапазон значений отдельно по каждой переменной разбивается на интервалы, как это делалось при построении гистограммы при применении критерия Пирсона. Затем вычисляется статистика χn и сравнивается с табличным значением статистики (распределения) χ² с (r-1)*(s-1) степенями свободы, где r и s – количество интервалов, на которые разбит диапазон изменения каждой переменной. Так как в нашем случае диапазон изменения каждой переменной разбит на одно и то же число К, то r и s одинаковы. Гипотеза о независимости двух случайных величин отвергается с уровнем значимости α, если χn> χ².
Для подсчёта статистики необходимо определить количество точек, попавших в каждый интервал по переменной XX, количество точек, попавших в каждый интервал по переменной YY, количество точек, попавших одновременно в интервалы по двум переменным (в соответствующие прямоугольники). Для этого найдём частоты попадания выборочных значений в каждый k-ый интервал по обеим переменным и количество точек, попавших одновременно в оба интервала по двум переменным.
Пусть K – количество интервалов, на которые разбит диапазон изменения каждой переменной. Количество интервалов К вычисляется по правилу Стургерса. Для вычисления используется встроенная функция Mathcad (3.11):
, (3.11)где n – количество реализаций случайного процесса.
Тогда длину интервала можно вычислить по формуле (3.12):
, (3.12)где Xmax, Xmin – максимальное и минимальное значение реализации случайного процесса.
Для определения частоты попадания выборочных значений в каждый k-ый интервал по переменной Х воспользуемся формулой (3.13):
, (3.13)где k=1..K – номер интервала,
uk – точки, лежащие на границе интервала,
n – количество реализаций случайной величины
Сумма частот всех интервалов должна быть равна количеству реализаций случайной функции n, так как все точки функции распределены на K интервалах. Это условие проверяется формулой (3.14).
(3.14)Частота попадания в последний интервал равна 1. следовательно стоит объединить интервалы.
После объединения крайних интервалов получаем формулу для подсчета частот попадания (3.15), которая также проверяется суммой частот попадания всех интервалов (3.16).
(3.15) (3.16)Рассмотрим теперь вторую переменную YY. Максимальное и минимальное значение выборки, количество интервалов в гистограмме, длина интервала определяются аналогично. Частоты попадания выборочных значений в k-ый интервал по переменной YY, определяются формулой (3.17):
, (3.17)где uyk – точки, лежащие на границе интервала,
n – количество реализаций случайной величины,
k=1..K – номер интервала.
Правильность подсчёта частот попадания также проверяется суммой всех частот попадания:
Крайние интервалы объединяются аналогично переменной XX.
Теперь найдём количество точек, попавших одновременно в оба интервала по двум переменным (3.18):
(3.18)Преобразуем эту формулу (3.19):
. (3.19)Сумма точек, попавших одновременно в оба интервала по двум переменным должна быть равна количеству реализаций n:
где k и t – количество интервалов по каждой переменной соответственно.
Все предварительные расчёты для вычисления статистики произведены. Далее необходимо вычислить саму статистику (3.20):
, (3.20)где K-2 – количество интервалов по каждой переменной после объединения крайних интервалов,
– количество точек, попавших в i-ый интервал по переменной XX, – количество точек, попавших в j-ый интервал по переменной YY, – количество точек, попавших одновременно в i-ый и j-ый интервалы по двум переменным.Для вычисления табличной статистики необходимо высчитать количество степеней свободы (3.21):
ν=(r-1)(s-1), (3.21)
где r и s – количество интервалов по каждой переменной, то есть r=s=K-2, так как крайние интервалы были объединены.
Значит, количество степеней свободы вычисляются по формуле:
Табличное значение распределения можно вычислить с помощью специальной функции Mathcad (3.22):
, (3.22)где α – уровень значимости
Для данных двух случайных процессов XX и YY значение статистики
. При этом табличное значение распределения .Очевидно, что
, следовательно, гипотеза о независимости двух случайных величин отвергается.3.3 Определение эмпирических уровней регрессии XX на YY и YY на XX
Если получена выборка системы двух случайных величин, то регрессией, например, величины XX на YY называют любую функцию XX=f(YY), приближенно представляющую статистическую зависимость XX от YY.
Эмпирическое уравнение регрессии YY на XX выглядит следующим образом (3.23):
, (3.23)где
и - корни квадратные из дисперсий функций XX и YY соответственно,rxy – коэффициент корреляции,
Ymean, Xmean – средние значения функций соответственно.
График 5 - Регрессия YY на XX: XXX - функция XX до сортировки, YYY - функция YY до сортировки.
Эмпирическое уравнение регрессии XX на YY определяется аналогично (3.24):
(3.24)График 6 – Регрессия XX на YY
Таким образом, определены уравнения регрессии YY на XX и XX на YY.
3.4 Оценка статистических характеристик случайного процесса в зависимости от времени
После проведения n реализаций интегрирований системы случайного процесса, необходимо оценить его статистические характеристики в зависимости от времени t.
При этом оцениваются те же статистические характеристики, что и в момент времени
:1) математические ожидания переменных состояния;
2) дисперсии переменных состояния;
3) корреляционный момент;
4) нормированный корреляционный момент (коэффициент корреляции)
Математические ожидания переменных состояния оценивается по следующим формулам (3.25-3.26):
, (3.25) , (3.26)