Практическая работа
по курсу «Математические модели окружающей среды»
Задано временное изменение уровня воды в некоторых пунктах за период примерно в 170 лет.
Применить методы математической статистики для оценки характеристик и качества имеющихся данных наблюдений. Выполнить прогноз подъема уровня воды на будущее и проверить качество прогноза на уже имеющихся данных.
1. Рассчитать моменты ряда (среднее и среднеквадратичное значение), построить функцию распределения и плотность функции распределения. Выполнить ее аппроксимацию теоретическими зависимостями.
Рис. 1.1. Изменение уровня воды за период в 102 года
Минимальный уровень воды = 0.06328, максимальное значение уровня = 0.6792
Заменим простой статистический ряд на статистический ряд с меньшим числом слагаемых, равным 100. И для такого ряда рассчитаем частоту события (в качестве события берем средний уровень воды).
Таким образом, имеем 100 интервалов, для каждого вычисляется частота события (число событий в статистическом ряде, когда X = x, к общему числу событий)
.
В нашем случае имеем N=1024 события, а m – число уровней, попавших i-ый интервал Очевидны свойства этой частоты
Частоту различных уровней воды можно изобразить графически
Рис. 1.2. График зависимости частоты от среднего уровня воды
Статистическая функция распределения есть «частота» события Х < x в данном статистическом интервале
.
Рис. 1.3. Функция распределения Эта функция F*(x) является неубывающей со следующими пределами: F*(x® –¥) = 0, F*(x® + ¥) = 1.С функцией распределения F(x) связана плотность функции распределения f(x)
.которая удовлетворяет следующим соотношениям:
f(x) ³ 0, òf(x) dx = 1,
Рис. 1.4. Плотность функции распределения
Была выполнена аппроксимация плотности функции распределения теоретическими зависимостями: полиномами 6-ой, 9-ой, 15-ой степени, тригонометрическими многочленами. Оптимальным приближением оказался полином 9-ой степени.
В качества критерия оптимальной аппроксимации использовали критерий Пирсона
Рис. 1.5. Аппроксимация плотность функции распределения полиномом 9-ой степени
Для нового ряда по имеющимся данным можно рассчитать математическое ожидание, характеризующее среднее значение уровня воды
,и среднеквадратичное отклонение, характеризующее средний разброс этих значений:
s*=
.где
- дисперсия:xi – среднее значение случайной величины внутри разряда.
В нашем случае, средний уровень воды равен 0.41, а среднеквадратичное отклонение – 0.119
2. В какой степени данный ряд является стационарным? На каких временах данный ряд можно считать стационарным? Дать оценки моментов для «кусков» ряда и построить гистограммы оценок
Для того чтобы ряд был стационарным, должны быть выполнены условия
- корреляционная функция не зависит от времени
математическое ожидание
- дисперсия
-
Для проверки стационарности делим исходный ряд на
кусков, и для каждого такого куска проверяем выполнение трех условий.– Корреляционная функция.
Фиксируем
, где N – количество точек.Считаем автокорреляционную функцию для первого отрезка, а затем – корреляционную функцию для каждых двух соседних кусков. Получаем значение корреляционной функции при фиксированном
для каждого куска ряда.Если процесс стационарный, то все значения должны совпадать со значением автокорреляционной функции.
Рис. 2.1. Графики зависимости корреляционной функции от номера отрезка при различных
.В качестве оценки корреляционной функции вычислили среднеквадратичное отклонение от значения автокорреляционной функции.
Рис. 2.2. Зависимость среднеквадратичного отклонения от
– Математическое ожидание
Для каждого «куска» ряда вычисляется математическое ожидание
( ; ). Затем находим среднее от и среднеквадратичное отклонение s*= .- Дисперсия
Для каждого «куска» ряда вычисляется дисперсия
( ; ). Затем считаем среднее от и среднеквадратичное отклонение s*= .Рис. 2.3. Зависимости среднеквадратичного отклонения D(M) и D(D) от
.В нашем случае, критерием стационарности является минимум среднеквадратичного отклонения от значения автокорреляционной функции, минимум
и .Этому условию удовлетворяет «кусок» ряда, длиной
.Таким образом, исходный ряд стационарен на периоде T=21 год.
1. Оценка математического ожидания
Проверяем
- состоятельность оценки для каждого стационарного «куска» ряда.
,где
– математическое ожидание на стационарном периоде – среднее значение в зависимости от числа данных- несмещенность оценки
M [a*] = a,
Номер интервала | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
M [a*] | 0,40938 | 0,41218 | 0,41058 | 0,41152 | 0,40758 | 0,41118 | 0,41259 | 0,40985 |
a | 0,40714 | 0,40661 | 0,40437 | 0,4080 | 0,40492 | 0,40906 | 0,41206 | 0,41018 |
2. Оценка дисперсии
Проверяем
- состоятельность оценки для каждого стационарного «куска» ряда.
,где
– среднеквадратичное отклонение на стационарном периоде - среднеквадратичное отклонение в зависимости от числа данных