Рис.2.5.1. Автокорреляционная функция ряда х4 (процент людей, у которых сахарный диабет передался по наследству(наследственная предрасположенность)
Рис. 2.5.2. Автокорреляционная функция ряда х4 после устранения тенденции.
Рис.2.6.1. Автокорреляционная функция ряда х5
.
Рис. 2.6.2. Автокорреляционная функция ряда х5 после устранения тенденции.
Построенная для х5 автокорреляционная функция (рис. 2.6.1.) показывает высокую зависимость смежных уровней ряда (коэффициент автокорреляции r1=0,642). Остальные коэффициенты невелики по значению и статистически незначимы на уровне 5%, за исключением r4=-0,424. Можно сделать вывод о наличии краткосрочной тенденции. После устранения тенденции методом последовательных разностей все коэффициенты стали небольшими и незначимыми на уровне 5% (рис. 2.1.2), скорей всего, ряд стал случайным.
Проанализировав полученные автокорреляционные функции, можно сделать вывод, что ряды у,х1,х2,х3,х4 (рис2.1.1 - 2.5.1) содержат долгосрочную тенденцию. Для таких рядов лучше всего подходит трендовая модель вида,
, так как наблюдается долгосрочная тенденция. Далее мы рассмотрим трендовую модель.Y_1 D(-1) | X1_1 D(-1); D(-1) | X2_1 D(-1) | X3_1 D(-1) | X4_1 D(-1); D(-1) | Х5_1 D(-1) | |
1 | 0,077 | -0,004 | 0,012 | 0,027 | -0,002 | -0,034 |
2 | 0,023 | -0,003 | 0,049 | 0,019 | -0,002 | -0,070 |
3 | 0,360 | -0,004 | 0,023 | 0,031 | 0,002 | -0,038 |
4 | 0,110 | 0,007 | -0,010 | 0,003 | -0,028 | -0,054 |
5 | 0,174 | 0,051 | 0,040 | 0,020 | 0,005 | 0,035 |
6 | 0,026 | -0,034 | 0,060 | 0,030 | -0,001 | 0,021 |
7 | 0,080 | -0,004 | 0,016 | 0,050 | 0,013 | 0,059 |
8 | 0,250 | 0,084 | 0,031 | 0,048 | 0,002 | 0,044 |
9 | -0,400 | 0,002 | 0,002 | 0,002 | -0,006 | 0,029 |
10 | 0,176 | -0,052 | 0,025 | 0,076 | 0,006 | -0,021 |
11 | -0,076 | 0,003 | 0,062 | 0,042 | 0,002 | -0,017 |
12 | 0,190 | 0,018 | 0,047 | 0,131 | 0,007 | -0,033 |
13 | 0,010 | -0,029 | 0,034 | 0,053 | 0,002 | -0,026 |
14 | 0,350 | 0,016 | 0,081 | 0,089 | 0,003 | -0,013 |
15 | 0,090 | -0,034 | 0,318 | 0,159 | -0,001 | -0,115 |
16 | 0,030 | 0,029 | 0,023 | 0,060 | -0,002 | -0,009 |
На этом этапе в исследовании выявляется зависимость уровня процентов людей, болеющих сахарным диабетом (Y) от показателей, включенных в факторный набор. При исследовании временных рядов важно не только выявить непосредственное воздействие уровня факторного признака на результирующий (речь идет о корреляции), но и учесть возможность существования запаздывания, то есть такой ситуации, когда влияние одного показателя на другой проявляется через какой-то временной интервал (это и позволяет сделать лаговая корреляция). Показателем зависимости между признаками является коэффициент корреляции (или коэффициент лаговой корреляции), его знак и величина позволяют сделать вывод о наличии, силе и направлении связи.
Построив функции перекрестной корреляции Y и факторных признаков, проанализируем полученные коэффициенты корреляции и лаговой корреляции. Для всех коэффициентов, кроме х3, принят уровень значимости α=5%, для х3 принят α=10 % .
Рис. 3.1. Функция перекрестной корреляции У и Х1 (процент людей, которые перенесли вирусный гепатит)
Анализируя рассчитанные коэффициенты, можно сделать вывод, что корреляционная связь между уровнем процентов людей, которые перенесли гепатит и процентом людей, у которых сахарный диабет передался по наследству (рис. 3.1), невысока и статистически незначима (коэффициент корреляции rx1y=0,2294). Такая ситуация может быть объяснена тем, что процент людей, которые перенесли вирусный гепатит оказывает косвенное влияние на процент людей, болеющих сахарным диабетом.
Рис. 3.2. Функция перекрестной корреляции У и Х2 (процент людей, страдающих излишним весом)
Статистически значимой связи между процентом людей, болеющих сахарным диабетом и процентом людей, страдающих излишним весом (Х2) в ходе исследования обнаружено не было: коэффициент корреляции и коэффициенты лаговой корреляции между этими показателями невысоки и статистически незначимы на уровне 5% (рис. 3.2). Такая ситуация может быть объяснена тем, что не все полные люди обязательно болеют сахарным диабетом (т.е. х2 оказывает на У не непосредственное, а косвенное влияние), это могут быть: бывшие спортсмены; женщины после родов; люди, бросившее курить и др.
Рис. 3.3. Функция перекрестной корреляции У и Х3 (процент людей, у которых болезнь эндокринной системы)
Коэффициент лаговой корреляции с лагом равным 0, значимый на 10%-ном уровне, показывает наличие прямой сильной связи между признаками Х3 и Y (r=0,7265), что говорит о влиянии на процент людей, болеющих сахарным диабетом такого показателя, как процент людей, у которых болезнь эндокринной системы (х3).Это говорит о том, что подтвердилась гипотеза, так как сахарный диабет – это и есть заболевание эндокринной системы.
Рис. 3.4. Функция перекрестной корреляции У и Х4 (процент людей, у которых сахарный диабет передался по наследству (наследственная предрасположенность)).
Коэффициент лаговой корреляции с лагом 4, значимый на 5%-ном уровне, показывает наличие прямой умеренной связи между признаками как Х4 и Y (r=0,6283),так и обратной между У и Х4 (r= -0,605): процент людей, у которых сахарный диабет оказывает большое влияние на болеющих сахарным диабетом с наследственной предрасположенностью и наоборот, чем больше людей, у которых наследственная предрасположенность к сахарному диабету, тем больше в дальнейшем больных сахарным диабетом. Но х4 в большей степени влияет на у, так как из-за репродуктивной функции людей с наследственной предрасположенностью все больше рождается людей, больных сахарным диабетом. Это говорит о том, что подтвердилась гипотеза о воздействии этого показателя на число больных.
Рис. 3.5. Функция перекрестной корреляции У и Х5 (процент людей, с острыми кишечными заболеваниями)
Гипотеза о наличии связи процента людей с ОКЗ и процентом болеющих сахарным диабетом статистически не подтвердилась: коэффициент корреляции и коэффициенты лаговой корреляции оказались невелики и незначимы на уровне 5% (рис. 3.5).
Таблица парных коэффициентов корреляции показателей с уровнями
Значимости по новым данным
Y | X1 | X2 | X3 | X4 | X5 | |
Y | 1,0000 | ,2211 | ,1599 | ,5640 | ,7294 | -,1510 |
p= --- | p=,513 | p=,620 | p=,071 | p=,011 | p=,658 | |
X1 | ,2211 | 1,0000 | -,2864 | -,1358 | -,0557 | ,4157 |
p=,513 | p= --- | p=,393 | p=,691 | p=,871 | p=,204 | |
X2 | ,1599 | -,2864 | 1,0000 | ,1763 | ,2854 | -,4720 |
p=,620 | p=,393 | p= --- | p=,604 | p=,395 | p=,056 | |
X3 | ,5640 | -,1358 | ,1763 | 1,0000 | ,1244 | -,4779 |
p=,071 | p=,691 | p=,604 | p= --- | p=,634 | p=,052 | |
X4 | ,7294 | -,0557 | ,2854 | ,1244 | 1,0000 | -,4435 |
p=,011 | p=,871 | p=,395 | p=,634 | p= --- | p=,172 | |
X5 | -,1510 | ,4157 | -,4720 | -,4779 | -,4435 | 1,0000 |
p=,658 | p=,204 | p=,056 | p=,052 | p=,172 | p= --- |
2.4. Построение регрессионной модели.
На предыдущем этапе была исследована взаимосвязь результирующего признака Y с каждым из признаков факторного набора. В результате была обнаружена статистически значимая на уровне 5% прямая умеренная связь Ус фактором х4, причем влияние фактора х4 на результирующий признак происходит с временным лагом τ=4, и была обнаружена статистически значимая на уровне 10% прямая сильная связь между х3 и у, влияние фактора х3 на результирующий признак происходит с временным лагом τ=0 . Построим множественную регрессионную модель, отражающую зависимость количества людей, у которых наследственная предрасположенность к сахарному диабету(х4) болезнь эндокринной системы(х3) на количество людей с сахарным диабетом(Y). Для построения модели ряд х4 предварительно сдвигаются относительно ряда Y на 4 периода, а х3 остается на месте.
Y_1 D(-1) | X1_1 D(-1); D(-1) | X2_1 D(-1) | X3_1 D(-1) | X4_1 D(-1); D(-1) | ||
1 | 0,077 | 0,012 | 0,027 | -0,034 | ||
2 | 0,023 | -0,003 | 0,049 | 0,019 | -0,070 | |
3 | 0,360 | -0,004 | 0,023 | 0,031 | -0,038 | |
4 | 0,110 | 0,007 | -0,010 | 0,003 | -0,054 | |
5 | 0,174 | 0,051 | 0,040 | 0,020 | -0,002 | 0,035 |
6 | 0,026 | -0,034 | 0,060 | 0,030 | -0,002 | 0,021 |
7 | 0,080 | -0,004 | 0,016 | 0,050 | 0,002 | 0,059 |
8 | 0,250 | 0,084 | 0,031 | 0,048 | -0,028 | 0,044 |
9 | -0,400 | 0,002 | 0,002 | 0,002 | 0,005 | 0,029 |
10 | 0,176 | -0,052 | 0,025 | 0,076 | -0,001 | -0,021 |
11 | -0,076 | 0,003 | 0,062 | 0,042 | 0,013 | -0,017 |
12 | 0,190 | 0,018 | 0,047 | 0,131 | 0,002 | -0,033 |
13 | 0,010 | -0,029 | 0,034 | 0,053 | -0,006 | -0,026 |
14 | 0,350 | 0,016 | 0,081 | 0,089 | 0,006 | -0,013 |
15 | 0,090 | -0,034 | 0,318 | 0,159 | 0,002 | -0,115 |
16 | 0,030 | 0,029 | 0,023 | 0,060 | 0,007 | -0,009 |
Построение множественной регрессионной модели: