Смекни!
smekni.com

Анализ оценки состояния людей, больных сахарным диабетом в Красноярском крае (стр. 3 из 4)


Рис.2.5.1. Автокорреляционная функция ряда х4 (процент людей, у которых сахарный диабет передался по наследству(наследственная предрасположенность)


Рис. 2.5.2. Автокорреляционная функция ряда х4 после устранения тенденции.


Рис.2.6.1. Автокорреляционная функция ряда х5



.

Рис. 2.6.2. Автокорреляционная функция ряда х5 после устранения тенденции.

Построенная для х5 автокорреляционная функция (рис. 2.6.1.) показывает высокую зависимость смежных уровней ряда (коэффициент автокорреляции r1=0,642). Остальные коэффициенты невелики по значению и статистически незначимы на уровне 5%, за исключением r4=-0,424. Можно сделать вывод о наличии краткосрочной тенденции. После устранения тенденции методом последовательных разностей все коэффициенты стали небольшими и незначимыми на уровне 5% (рис. 2.1.2), скорей всего, ряд стал случайным.

Проанализировав полученные автокорреляционные функции, можно сделать вывод, что ряды у,х1,х2,х3,х4 (рис2.1.1 - 2.5.1) содержат долгосрочную тенденцию. Для таких рядов лучше всего подходит трендовая модель вида,

, так как наблюдается долгосрочная тенденция. Далее мы рассмотрим трендовую модель.

Новые данные

Y_1 D(-1) X1_1 D(-1); D(-1) X2_1 D(-1) X3_1 D(-1) X4_1 D(-1); D(-1)

Х5_1

D(-1)

1 0,077 -0,004 0,012 0,027 -0,002 -0,034
2 0,023 -0,003 0,049 0,019 -0,002 -0,070
3 0,360 -0,004 0,023 0,031 0,002 -0,038
4 0,110 0,007 -0,010 0,003 -0,028 -0,054
5 0,174 0,051 0,040 0,020 0,005 0,035
6 0,026 -0,034 0,060 0,030 -0,001 0,021
7 0,080 -0,004 0,016 0,050 0,013 0,059
8 0,250 0,084 0,031 0,048 0,002 0,044
9 -0,400 0,002 0,002 0,002 -0,006 0,029
10 0,176 -0,052 0,025 0,076 0,006 -0,021
11 -0,076 0,003 0,062 0,042 0,002 -0,017
12 0,190 0,018 0,047 0,131 0,007 -0,033
13 0,010 -0,029 0,034 0,053 0,002 -0,026
14 0,350 0,016 0,081 0,089 0,003 -0,013
15 0,090 -0,034 0,318 0,159 -0,001 -0,115
16 0,030 0,029 0,023 0,060 -0,002 -0,009

3 Анализ корреляции и лаговой корреляции

На этом этапе в исследовании выявляется зависимость уровня процентов людей, болеющих сахарным диабетом (Y) от показателей, включенных в факторный набор. При исследовании временных рядов важно не только выявить непосредственное воздействие уровня факторного признака на результирующий (речь идет о корреляции), но и учесть возможность существования запаздывания, то есть такой ситуации, когда влияние одного показателя на другой проявляется через какой-то временной интервал (это и позволяет сделать лаговая корреляция). Показателем зависимости между признаками является коэффициент корреляции (или коэффициент лаговой корреляции), его знак и величина позволяют сделать вывод о наличии, силе и направлении связи.

Построив функции перекрестной корреляции Y и факторных признаков, проанализируем полученные коэффициенты корреляции и лаговой корреляции. Для всех коэффициентов, кроме х3, принят уровень значимости α=5%, для х3 принят α=10 % .


Рис. 3.1. Функция перекрестной корреляции У и Х1 (процент людей, которые перенесли вирусный гепатит)

Анализируя рассчитанные коэффициенты, можно сделать вывод, что корреляционная связь между уровнем процентов людей, которые перенесли гепатит и процентом людей, у которых сахарный диабет передался по наследству (рис. 3.1), невысока и статистически незначима (коэффициент корреляции rx1y=0,2294). Такая ситуация может быть объяснена тем, что процент людей, которые перенесли вирусный гепатит оказывает косвенное влияние на процент людей, болеющих сахарным диабетом.


Рис. 3.2. Функция перекрестной корреляции У и Х2 (процент людей, страдающих излишним весом)

Статистически значимой связи между процентом людей, болеющих сахарным диабетом и процентом людей, страдающих излишним весом (Х2) в ходе исследования обнаружено не было: коэффициент корреляции и коэффициенты лаговой корреляции между этими показателями невысоки и статистически незначимы на уровне 5% (рис. 3.2). Такая ситуация может быть объяснена тем, что не все полные люди обязательно болеют сахарным диабетом (т.е. х2 оказывает на У не непосредственное, а косвенное влияние), это могут быть: бывшие спортсмены; женщины после родов; люди, бросившее курить и др.


Рис. 3.3. Функция перекрестной корреляции У и Х3 (процент людей, у которых болезнь эндокринной системы)

Коэффициент лаговой корреляции с лагом равным 0, значимый на 10%-ном уровне, показывает наличие прямой сильной связи между признаками Х3 и Y (r=0,7265), что говорит о влиянии на процент людей, болеющих сахарным диабетом такого показателя, как процент людей, у которых болезнь эндокринной системы (х3).Это говорит о том, что подтвердилась гипотеза, так как сахарный диабет – это и есть заболевание эндокринной системы.



Рис. 3.4. Функция перекрестной корреляции У и Х4 (процент людей, у которых сахарный диабет передался по наследству (наследственная предрасположенность)).

Коэффициент лаговой корреляции с лагом 4, значимый на 5%-ном уровне, показывает наличие прямой умеренной связи между признаками как Х4 и Y (r=0,6283),так и обратной между У и Х4 (r= -0,605): процент людей, у которых сахарный диабет оказывает большое влияние на болеющих сахарным диабетом с наследственной предрасположенностью и наоборот, чем больше людей, у которых наследственная предрасположенность к сахарному диабету, тем больше в дальнейшем больных сахарным диабетом. Но х4 в большей степени влияет на у, так как из-за репродуктивной функции людей с наследственной предрасположенностью все больше рождается людей, больных сахарным диабетом. Это говорит о том, что подтвердилась гипотеза о воздействии этого показателя на число больных.



Рис. 3.5. Функция перекрестной корреляции У и Х5 (процент людей, с острыми кишечными заболеваниями)

Гипотеза о наличии связи процента людей с ОКЗ и процентом болеющих сахарным диабетом статистически не подтвердилась: коэффициент корреляции и коэффициенты лаговой корреляции оказались невелики и незначимы на уровне 5% (рис. 3.5).

Таблица парных коэффициентов корреляции показателей с уровнями

Значимости по новым данным

Y X1 X2 X3 X4 X5
Y 1,0000 ,2211 ,1599 ,5640 ,7294 -,1510
p= --- p=,513 p=,620 p=,071 p=,011 p=,658
X1 ,2211 1,0000 -,2864 -,1358 -,0557 ,4157
p=,513 p= --- p=,393 p=,691 p=,871 p=,204
X2 ,1599 -,2864 1,0000 ,1763 ,2854 -,4720
p=,620 p=,393 p= --- p=,604 p=,395 p=,056
X3 ,5640 -,1358 ,1763 1,0000 ,1244 -,4779
p=,071 p=,691 p=,604 p= --- p=,634 p=,052
X4 ,7294 -,0557 ,2854 ,1244 1,0000 -,4435
p=,011 p=,871 p=,395 p=,634 p= --- p=,172
X5 -,1510 ,4157 -,4720 -,4779 -,4435 1,0000
p=,658 p=,204 p=,056 p=,052 p=,172 p= ---

2.4. Построение регрессионной модели.

На предыдущем этапе была исследована взаимосвязь результирующего признака Y с каждым из признаков факторного набора. В результате была обнаружена статистически значимая на уровне 5% прямая умеренная связь Ус фактором х4, причем влияние фактора х4 на результирующий признак происходит с временным лагом τ=4, и была обнаружена статистически значимая на уровне 10% прямая сильная связь между х3 и у, влияние фактора х3 на результирующий признак происходит с временным лагом τ=0 . Построим множественную регрессионную модель, отражающую зависимость количества людей, у которых наследственная предрасположенность к сахарному диабету(х4) болезнь эндокринной системы(х3) на количество людей с сахарным диабетом(Y). Для построения модели ряд х4 предварительно сдвигаются относительно ряда Y на 4 периода, а х3 остается на месте.

Y_1 D(-1) X1_1 D(-1); D(-1) X2_1 D(-1) X3_1 D(-1) X4_1 D(-1); D(-1)
1 0,077 0,012 0,027 -0,034
2 0,023 -0,003 0,049 0,019 -0,070
3 0,360 -0,004 0,023 0,031 -0,038
4 0,110 0,007 -0,010 0,003 -0,054
5 0,174 0,051 0,040 0,020 -0,002 0,035
6 0,026 -0,034 0,060 0,030 -0,002 0,021
7 0,080 -0,004 0,016 0,050 0,002 0,059
8 0,250 0,084 0,031 0,048 -0,028 0,044
9 -0,400 0,002 0,002 0,002 0,005 0,029
10 0,176 -0,052 0,025 0,076 -0,001 -0,021
11 -0,076 0,003 0,062 0,042 0,013 -0,017
12 0,190 0,018 0,047 0,131 0,002 -0,033
13 0,010 -0,029 0,034 0,053 -0,006 -0,026
14 0,350 0,016 0,081 0,089 0,006 -0,013
15 0,090 -0,034 0,318 0,159 0,002 -0,115
16 0,030 0,029 0,023 0,060 0,007 -0,009

Построение множественной регрессионной модели: