Видно, что атрибут cup_of_tea_per_day (количество чашек чая в день) вносит наименьший вклад в результирующую функцию. Поэтому, скорее всего, аналитику стоит принять решение «выкинуть» этот атрибут из расчетов значений итоговой функции f.
Соответственно, после этого статистика для важности атрибутов примет следующий вид:
Теперь, когда мы определились, по каким атрибутам мы будем оценивать функцию, можно строить регрессионную модель.
Решив задачу регрессии, получим результаты. Тут они не приводятся, в виду большого числа атрибутов. Приведем соответствующие невязки:
Видно, что тут погрешности на порядок выше. Это обусловлено «сильной» нелинейностью функции f. Приведем соответствующие погрешности для данного примера:
И достоверность предсказания.
Видно, что метод показал достаточно точные результаты на не линейных функциях!
По результатам выполнения работы, средства Data Mining показали перспективность и состоятельность применения к задачам оценки количественных характеристик работ. Результаты, полученные на тестовых модельных данных, показали достаточную точность, чтобы считать средства Data mining пригодными для анализа проектов на основе накопленных данных, полученных с выполненных проектов.
Автор считает целесообразным продолжить исследования по данной тематике, в частности, с использованием реальных данных по проектам, в рамках магистерской работы. Также дальнейшие исследования должны включать вопросы:
· области применимости предложенного метода, выявлению ограничений данного подхода к оценке реальных проектов,
· анализу влияния «шума», всегда присутствующего в данных, характеризующих реальные проекты,
· чувствительности к изменению значений параметров (жесткость системы).
1. Руководство PMBOK®, 2004 Project Management Institute, Four Campus Boulevard, Newtown Square, PA 19073-3299 USA / США.
2. Manfred Bundschuh, Carol Dekkers, The IT Measurement Compendium.
3. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP – СПб.: БХВ-Петербург, 2008.
4. http://www.oracle.com/technology/documentation/datamining.html
5. Ньюэл Майкл В. Управление проектами для профессионалов. Руководство по подготовке к сдаче сертификационного экзамена – М.: КУДИЦ-ПРЕСС, 2008.
6. Хардман Р., МакЛафлин М. Oracle PL/SQL для профессионалов – М.: Лори, 2007.
Таблица данных к примеру 1:
F | PREDICTION | df/f, % | ID | LOE1 | LOE2 | LOE3 | LOE4 |
198 | 191.25 | 3.409 | 97 | 26 | 50 | 25 | 84 |
153 | 148.124 | 3.187 | 3 | 57 | 48 | 22 | 24 |
90 | 92.785 | 3.095 | 55 | 2 | 43 | 15 | 30 |
112 | 114.784 | 2.486 | 78 | 51 | 25 | 9 | 22 |
163 | 165.785 | 1.709 | 63 | 3 | 86 | 51 | 13 |
166 | 163.215 | 1.678 | 52 | 23 | 44 | 39 | 60 |
262 | 257.833 | 1.591 | 91 | 93 | 56 | 48 | 52 |
178 | 180.785 | 1.565 | 79 | 36 | 16 | 47 | 76 |
184 | 186.785 | 1.514 | 29 | 18 | 14 | 97 | 31 |
184 | 186.784 | 1.513 | 96 | 30 | 54 | 7 | 89 |
186 | 188.785 | 1.497 | 19 | 85 | 50 | 43 | 8 |
190 | 192.785 | 1.466 | 76 | 103 | 63 | 5 | 4 |
197 | 199.785 | 1.414 | 38 | 48 | 67 | 31 | 51 |
198 | 200.785 | 1.407 | 59 | 108 | 13 | 4 | 56 |
200 | 202.786 | 1.393 | 39 | 6 | 52 | 3 | 115 |
201 | 203.786 | 1.386 | 68 | 6 | 26 | 57 | 102 |
201 | 198.215 | 1.386 | 13 | 20 | 21 | 88 | 63 |
207 | 209.785 | 1.345 | 62 | 7 | 17 | 114 | 47 |
230 | 232.785 | 1.211 | 48 | 111 | 22 | 85 | 8 |
229 | 226.26 | 1.196 | 67 | 57 | 31 | 22 | 104 |
237 | 239.784 | 1.175 | 27 | 92 | 37 | 82 | 26 |
238 | 240.784 | 1.17 | 9 | 91 | 42 | 31 | 71 |
241 | 238.215 | 1.155 | 71 | 27 | 28 | 13 | 136 |
245 | 247.785 | 1.137 | 95 | 134 | 8 | 50 | 28 |
242 | 239.256 | 1.134 | 7 | 45 | 94 | 36 | 56 |
248 | 250.784 | 1.123 | 20 | 110 | 4 | 121 | 13 |
249 | 246.216 | 1.118 | 44 | 37 | 45 | 15 | 128 |
255 | 252.215 | 1.092 | 42 | 38 | 34 | 61 | 106 |
256 | 258.785 | 1.088 | 14 | 57 | 9 | 11 | 145 |
257 | 259.784 | 1.083 | 41 | 37 | 71 | 92 | 57 |
257 | 254.216 | 1.083 | 22 | 8 | 25 | 87 | 128 |
259 | 256.216 | 1.075 | 93 | 115 | 34 | 74 | 24 |
261 | 258.216 | 1.067 | 73 | 68 | 43 | 102 | 37 |
262 | 264.785 | 1.063 | 81 | 39 | 117 | 92 | 14 |
264 | 261.214 | 1.055 | 53 | 28 | 51 | 120 | 45 |
248 | 250.607 | 1.051 | 32 | 69 | 19 | 108 | 48 |
266 | 268.785 | 1.047 | 58 | 19 | 78 | 127 | 26 |
279 | 276.214 | 0.998 | 94 | 65 | 6 | 149 | 39 |
285 | 282.215 | 0.977 | 85 | 35 | 84 | 26 | 127 |
290 | 292.785 | 0.96 | 4 | 86 | 9 | 60 | 135 |
294 | 291.216 | 0.947 | 82 | 15 | 100 | 32 | 139 |
293 | 290.229 | 0.946 | 36 | 65 | 17 | 57 | 140 |
301 | 298.215 | 0.925 | 21 | 31 | 71 | 121 | 77 |
301 | 303.785 | 0.925 | 28 | 30 | 120 | 56 | 95 |
261 | 263.409 | 0.923 | 84 | 40 | 143 | 48 | 6 |
302 | 299.215 | 0.922 | 24 | 123 | 24 | 127 | 28 |
308 | 305.216 | 0.904 | 10 | 108 | 17 | 37 | 141 |
182 | 180.358 | 0.902 | 65 | 46 | 41 | 29 | 64 |
311 | 313.784 | 0.895 | 23 | 129 | 32 | 87 | 57 |
312 | 309.214 | 0.893 | 2 | 66 | 112 | 68 | 54 |
F | PREDICTION | df/f, % | ID | LOE1 | LOE2 | LOE3 | LOE4 |
319 | 316.216 | 0.873 | 17 | 144 | 44 | 77 | 32 |
322 | 324.785 | 0.865 | 45 | 127 | 101 | 47 | 40 |
322 | 324.786 | 0.865 | 60 | 88 | 66 | 56 | 108 |
324 | 321.216 | 0.859 | 75 | 109 | 63 | 76 | 63 |
325 | 327.784 | 0.857 | 70 | 107 | 98 | 59 | 58 |
333 | 335.784 | 0.836 | 74 | 142 | 69 | 87 | 29 |
335 | 332.216 | 0.831 | 80 | 66 | 112 | 77 | 67 |
344 | 341.215 | 0.81 | 40 | 149 | 81 | 41 | 50 |
349 | 351.784 | 0.798 | 98 | 132 | 72 | 102 | 43 |
350 | 352.784 | 0.796 | 57 | 55 | 121 | 68 | 106 |
363 | 365.784 | 0.767 | 16 | 70 | 91 | 114 | 86 |
366 | 363.215 | 0.761 | 90 | 140 | 50 | 72 | 95 |
370 | 367.215 | 0.753 | 83 | 37 | 148 | 112 | 73 |
374 | 371.216 | 0.744 | 18 | 100 | 86 | 129 | 59 |
380 | 377.216 | 0.733 | 35 | 148 | 84 | 85 | 51 |
382 | 379.215 | 0.729 | 12 | 136 | 146 | 56 | 44 |
225 | 223.382 | 0.719 | 69 | 47 | 55 | 73 | 44 |
390 | 387.216 | 0.714 | 11 | 94 | 52 | 101 | 143 |
284 | 285.985 | 0.699 | 34 | 47 | 77 | 40 | 110 |
420 | 417.216 | 0.663 | 72 | 73 | 125 | 138 | 83 |
420 | 417.216 | 0.663 | 64 | 66 | 90 | 106 | 150 |
432 | 429.215 | 0.645 | 26 | 149 | 123 | 94 | 66 |
307 | 305.055 | 0.634 | 77 | 71 | 121 | 59 | 43 |
450 | 447.215 | 0.619 | 66 | 106 | 120 | 86 | 138 |
200 | 201.231 | 0.616 | 86 | 38 | 55 | 26 | 77 |
477 | 474.216 | 0.584 | 46 | 130 | 135 | 104 | 108 |
240 | 238.623 | 0.574 | 6 | 21 | 18 | 88 | 107 |
325 | 323.144 | 0.571 | 30 | 147 | 65 | 98 | 15 |
282 | 283.49 | 0.528 | 51 | 90 | 145 | 10 | 19 |
278 | 276.552 | 0.521 | 15 | 101 | 29 | 115 | 28 |
269 | 270.32 | 0.491 | 5 | 4 | 141 | 27 | 83 |
281 | 282.27 | 0.452 | 61 | 126 | 53 | 29 | 55 |
292 | 293.252 | 0.429 | 88 | 92 | 3 | 53 | 144 |
291 | 289.845 | 0.397 | 99 | 137 | 36 | 77 | 23 |
291 | 290.081 | 0.316 | 25 | 139 | 28 | 52 | 44 |
325 | 325.98 | 0.302 | 8 | 73 | 149 | 87 | 15 |
308 | 307.108 | 0.29 | 92 | 144 | 39 | 27 | 76 |
358 | 357.043 | 0.267 | 87 | 62 | 123 | 71 | 94 |
345 | 344.099 | 0.261 | 47 | 132 | 51 | 83 | 65 |
237 | 236.462 | 0.227 | 31 | 7 | 66 | 7 | 131 |
292 | 292.476 | 0.163 | 43 | 138 | 28 | 49 | 51 |
259 | 259.418 | 0.162 | 1 | 18 | 43 | 113 | 84 |
292 | 292.459 | 0.157 | 56 | 114 | 44 | 57 | 62 |
264 | 263.898 | 0.039 | 89 | 47 | 4 | 137 | 65 |
209 | 209.075 | 0.036 | 37 | 103 | 10 | 29 | 56 |
277 | 276.942 | 0.021 | 50 | 104 | 55 | 66 | 42 |
Таблица данных к примеру 2.