Cl | 1 | 2 | 3 | Сумма | Относительная информативность |
122 | 1 | 8 | 1 | 10 | 9,2 |
112 | 2 | 4 | - | 6 | 5,5 |
111 | 2 | 1 | - | 3 | 2,8 |
113 | 4 | - | 5 | 9 | 8,9 |
121 | 6 | 5 | 1 | 12 | 15,9 |
132 | 3 | - | - | 3 | 0 |
223 | 2 | 2 | 1 | 5 | 7,6 |
233 | 2 | - | - | 2 | 0 |
232 | - | 1 | - | 1 | 0 |
123 | 4 | 2 | 3 | 9 | 13,8 |
221 | - | 1 | - | 1 | 0 |
212 | 5 | 4 | - | 9 | 8,9 |
213 | - | 2 | 2 | 4 | 4 |
321 | 2 | - | - | 2 | 0 |
332 | - | 2 | - | 2 | 0 |
333 | - | - | 4 | 4 | 0 |
313 | - | 1 | 1 | 2 | 2 |
312 | 1 | - | - | 1 | 0 |
322 | - | 2 | - | 2 | 0 |
211 | 1 | - | - | 1 | 0 |
сумма | 96 | 86,3 | |||
145,9-86,3=59,6 бит |
4. Суммарная защищенность, водопроводимость и тип территории
Cl | 1 | 2 | 3 | Сумма | Относительная информативность |
133 | 7 | - | - | 7 | 0 |
232 | 6 | 3 | - | 9 | 8,3 |
222 | 3 | 3 | - | 6 | 6 |
223 | 4 | 5 | 3 | 12 | 18,7 |
331 | 2 | - | - | 2 | 0 |
322 | - | 4 | - | 4 | 0 |
313 | - | - | 4 | 4 | 0 |
132 | 5 | 10 | - | 15 | 13,8 |
323 | - | 1 | 1 | 2 | 2 |
332 | 1 | 1 | - | 2 | 2 |
122 | 1 | 1 | - | 2 | 2 |
121 | 5 | 3 | - | 8 | 7,6 |
113 | - | 1 | 3 | 4 | 3,2 |
131 | 4 | - | - | 4 | 0 |
111 | - | 3 | - | 3 | 0 |
212 | - | - | 1 | 1 | 0 |
112 | - | 1 | 2 | 3 | 2,8 |
211 | - | 1 | - | 1 | 0 |
231 | 1 | - | - | 1 | 0 |
сумма | 96 | 70,3 | |||
145,9-70,3=75,6 бит |
В результате проведения расчетов информативности методом перебора, необходимо выбрать наиболее информативных три двоичных и один троичный признаков для того, чтобы произвести тестирование модели. Итоговые значения наиболее информативных сложных двоичных и троичных признаков сведены в таблице 6.
Таблица 6. Наиболее информативные сложные признаки
Показатели | Информативность | |
Бит | % | |
40,0 | 27,4 | |
41,8 | 28,6 | |
63,6 | 43,6 | |
75,6 | 51,9 | |
Уровень концентрации хлоридов | 145,9 | 100 |
3. Тестирование модели
После определения более информативных сложных признаков необходимо произвести тестирование сформированной модели для выяснения её пригодности для дальнейшего прогноза. Для этого используется контрольная модель, с помощью которой, с использованием матриц взаимных переходов, считается сумма голосов. В контрольной части смотрят сочетание значений признаков и по матрице взаимных переходов определяют количество попаданий этих сочетаний в 1, 2 и 3 ранг по хлору и в итоге суммируют их. Тот ранг, в который попадет наибольшее значение сочетаний, будет считаться прогнозным. Этот ранг будет сравниваться с фактическим значением ранга по хлору. Чем больше будет совпадений прогнозных значений с фактическими, тем более пригодной для прогноза окажется наша модель.
Результаты диагностирования модели приведены в таблице 7
Таблица 7. Диагностирование модели № блока | Ранги | Содержание хлора | |||
1 | 2 | 3 | фактическое | прогнозное | |
97 | 2 | 1 | |||
98 | 1 | 2 | |||
99 | 3 | 1 | |||
100 | 2 | 3 | |||
101 | 2 | 2 | |||
102 | 2 | 3 | |||
103 | 3 | 2 | |||
104 | 2 | 2 | |||
105 | 2 | 1 | |||
106 | 1 | 3 | |||
107 | 2 | 2 | |||
108 | 1 | 3 | |||
109 | 2 | 1 | |||
110 | 1 | 2 | |||
111 | 3 | 1 | |||
112 | 2 | 3 | |||
113 | 2 | 2 | |||
114 | 2 | 3 | |||
115 | 3 | 1 | |||
116 | 2 | 2 | |||
117 | 2 | 1 | |||
118 | 1 | 3 | |||
119 | 2 | 2 | |||
120 | 1 | 3 |
Анализируя таблицу стоит обратить внимание на так называемый «отказ», который свидетельствует об недостаточности значений показателей входящих в ранг. В нашей ситуации при нашей модели, разбитой на 96 блоков, идеальным количеством значений входящих в 3 ранга составляло бы 32.. К сожалению, в нашей модели такое условие не выполняется. В некоторых случаях число значений входящих в ранг не превышает и 12. Это снижает эффективность нашей модели.