Существуют общие характерные особенности, отличающие поведение автокорреляционной функции стационарного временного ряда. Другими словами, можно описать в общих чертах схематичный вид коррелограммы стационарного временного ряда. Это обусловлено следующим общим соображением: очевидно, чем больше разнесены во времени члены временного ряда xt и xt+, тем слабее взаимосвязь этих членов и, соответственно, тем меньше должно быть по абсолютной величине значение r(). При этом в ряде случаев существует такое пороговое значение r0, начиная с которого все значения будут тождественно равны нулю.
Частная автокорреляционная функция rчаст(). С помощью этой функции реализуется идея измерения автокорреляции, существующей между разделенными тактами времени членами временного ряда xt и xt+, при устраненном опосредованном влиянии на эту взаимозависимость всех промежуточных членов этого временного ряда. Частная автокорреляция 1-го порядка может быть подсчитана с использованием соотношения:
где среднее значение анализируемого стационарного процесса.
Частные автокорреляции более высоких порядков могут быть подсчитаны аналогичным образом по элементам общей корреляционной матрицы R = ||rij||, в которой rij = = r(xi, xj) = r(|i j|), где i, j = 1,…, T и r(0) = 1. Так, например, частная автокорреляция 2-го порядка определяется по формуле:
Эмпирические (выборочные) версии автокорреляционных функций получаются с помощью тех же соотношений (2.4), (2.5) при замене участвующих в них теоретических значений автокорреляций r() их статистическими оценками .
Полученные таким образом частные автокорреляции rчаст(1),rчаст (2),… можно нанести на график, в котором роль абсциссы выполняет величина сдвига . Знание автокорреляционных функций r() и rчаст() оказывает существенную помощь в решении задачи подбора и идентификации модели анализируемого временного ряда.
Использование свойств этой функции в прикладном анализе временных рядов определяется как «спектральный анализ временных рядов». Достаточно полное описание этого подхода приведено, например, в [Дженкинс, Ватс (1971, 1972)] и [Ллойд, Ледерман (1990)]. Применительно к статистическому анализу экономических рядов динамики этот подход не получил широкого распространения, т.к. эмпирический анализ спектральной плотности требует в качестве своей информационной базы либо достаточно длинных стационарных временных рядов, либо нескольких траекторий анализируемого временного ряда (и та и другая ситуация весьма редки в практике статистического анализа экономических рядов динамики).
Для содержательного анализа важно, что величина спектральной плотности характеризует силу взаимосвязи, существующей между временным рядом xt и гармоникой с периодом 2/. Это позволяет использовать спектр как средство улавливания периодичностей в анализируемом временном ряду: совокупность пиков спектра определяет набор гармонических компонентов в разложении . Если в ряде содержится скрытая гармоника частоты , то в нем присутствуют также периодические члены с частотами /2, /3 и т.д. Это так называемое «эхо», повторяемое спектром на низких частотах. Эффект «эха» анализировался в статье [Granger (1963)] на примере ряда ежемесячных безналичных расчетов между банками США за 1875-1958 гг.
Можно несколько расширить класс моделей стационарных временных рядов, используемых при анализе конкретных рядов экономической динамики.
Определение 2.2. Ряд называется слабо стационарным (или стационарным в широком смысле), если его среднее значение, дисперсия и ковариации не зависят от t.
2.2. Неслучайная составляющая временного ряда и методы его сглаживания.
Существенную роль в решении задач выявления и оценивания трендовой, сезонной и циклической составляющих в разложении (1.1.1) играет начальный этап анализа, на котором:
выявляется сам факт наличия/отсутствия неслучайной (и зависящей от времени t) составляющей в разложении (1.1.1); по существу, речь идет о статистической проверке гипотезы
H0: Ext = = const (2.6)
(включая утверждение о взаимной статистической независимости членов исследуемого временного ряда) при различных вариантах конкретизации альтернативных гипотез типа
HА: Ext const;
строится оценка (аппроксимация) для неизвестной интегральной неслучайной составляющей f(t) = 1fтр(t) + 2(t) +3(t), т.е. решается задача сглаживания (элиминирования случайных остатков t) анализируемого временного ряда xt.
Методы выделения неслучайной составляющей в траектории, отражающей поведение временного ряда, подразделяются на два типа.
Методы первого типа (аналитические) основаны на допущении, что известен общий вид неслучайной составляющей в разложении
f(t) = 1fтр(t) + 2(t) +3(t). (2.8)
Например, если известно, что неслучайная составляющая временного ряда описывается линейной функцией времени f(t) = 0 + 1t, где 0 и 1 некоторые неизвестные параметры модели, то задача ее выделения (задача элиминирования случайных остатков или задача сглаживания временного ряда) сводится к задаче построения хороших оценок и для параметров модели.
Методы второго типа (алгоритмические) не связаны ограничительным допущением о том, что общий аналитический вид искомой функции (2.8) известен исследователю. В этом смысле они являются более гибкими, более привлекательными. Однако «на выходе» задачи они предлагают исследователю лишь алгоритм расчета оценки для искомой функции f(t) в любой наперед заданной точке t и не претендуют на аналитическое представление функции .
Аналитические методы выделения (оценки) неслучайной составляющей временного ряда. Эти методы реализуются в рамках моделей регрессии, в которых в роли зависимой переменной выступает переменная xt, а в роли единственной объясняющей переменной время t. Таким образом, рассматривается модель регрессии вида
xt = f(t, ) + t, t = 1,…, T, в которой общий вид функции f(t, ) известен, но неизвестны значения параметров = (0, 1,…, m). Оценки параметров строятся по наблюдениям . Выбор метода оценивания зависит от гипотетического вида функции f(t, ) и стохастической природы случайных регрессионных остатков t.
Алгоритмические методы выделения неслучайной составляющей временного ряда (методы скользящего среднего). В основе этих методов элиминирования случайных флуктуаций в поведении анализируемого временного ряда лежит простая идея: если «индивидуальный» разброс значений члена временного ряда xt около своего среднего (сглаженного) значения a характеризуется дисперсией 2, то разброс среднего из N членов временного ряда (x1 + x2 +…+ xT) / N около того же значения a будет характеризоваться гораздо меньшей величиной дисперсии, а именно дисперсией, равной 2 / N. А уменьшение меры случайного разброса (дисперсии) и означает как раз сглаживание соответствующей траектории. Поэтому выбирают некоторую нечетную «длину усреднения» N = 2m + 1, измеренную в числе подряд идущих членов анализируемого временного ряда. А затем сглаженное значение временного ряда xt вычисляют по значениям xtm, xtm+1,…, xt, xt+1,…, xt+m
где wk (k = m, m + 1,…, m) некоторые положительные «весовые» коэффициенты, в сумме равные единице, т.е. wk > 0 и . Поскольку, изменяя t от m + 1 до T m, мы как бы «скользим» по оси времени, то и методы, основанные на формуле (2.9), принято называть методами скользящей средней (МСС).
Очевидно, один МСС отличается от другого выбором параметров m и wk.
Определение параметров wk основано на следующей процедуре. В соответствии с теоремой Вейерштрасса любая гладкая функция f(x) при самых общих допущениях может быть локально представлена алгебраическим полиномом подходящей степени p. Поэтому берем первые 2m + 1 членов временного ряда x1,…, x2m+1, строим с помощью МНК полином степени p, аппроксимирующий поведение этой начальной части траектории временного ряда, и используем этот полином для определения оценки сглаженного значения f(t) временного ряда в средней (т.е. (m + 1)-й) точке этого отрезка ряда, т.е. полагаем . Затем «скользим» по оси времени на один такт и таким же способом подбираем полином той же степени p к отрезку временного ряда x2,…, xm+2 и определяем оценку сглаженного значения временного ряда в средней точке сдвинутого на единицу отрезка временного ряда, т.е. , и т.д.
В результате мы найдем оценки для сглаженных значений анализируемого временного ряда при всех t, кроме t = 1,…, m и t = T,… T m + 1.
Подбор наилучшего (в смысле критерия МНК) аппроксимирующего полинома к траектории анализируемого временного ряда приводит к формуле вида ,причем результат не зависит от того, для какого именно из «скользящих» временных интервалов был осуществлен этот подбор.
Метод экспоненциально взвешенного скользящего среднего (метод Брауна [Brown (1963)]). В соответствии с этим методом оценка сглаженного значения в точке t определяется как решение оптимизационной задачи вида
где 0 < < 1. Следовательно, веса k в критерии Q(f) обобщенного («взвешенного») МНК уменьшаются экспоненциально по мере удаления наблюдений xtk в прошлое. Решение оптимизационной задачи (2.10) дает:
В отличие от обычного МСС здесь скользит только правый конец интервала усреднения и, кроме того, веса экспоненциально уменьшаются по мере удаления в прошлое. Формула (2.11) дает оценку сглаженного значения временного ряда не в средней, а в правой конечной точке интервала усреднения.
2.3. Модели стационарных временных рядов и их идентификация.
В 2.2 рассматривался класс стационарных временных рядов, в рамках которого подбирается модель, пригодная для описания поведения случайных остатков исследуемого временного ряда (1). Здесь рассматривается набор линейных параметрических моделей из этого класса и методы их идентификации. Таким образом, речь здесь идет не о моделировании временных рядов, а о моделировании их случайных остатков t, получающихся после элиминирования из исходного временного ряда xt его неслучайной составляющей (2.8). Следовательно, в отличие от прогноза, основанного на регрессионной модели, игнорирующего значения случайных остатков, в прогнозе временных рядов существенно используется взаимозависимость и прогноз самих случайных остатков.