Смекни!
smekni.com

Факультет радиотехники и кибернетики (стр. 5 из 7)

Видно, что атрибут cup_of_tea_per_day (количество чашек чая в день) вносит наименьший вклад в результирующую функцию. Поэтому, скорее всего, аналитику стоит принять решение «выкинуть» этот атрибут из расчетов значений итоговой функции f.

Соответственно, после этого статистика для важности атрибутов примет следующий вид:

Теперь, когда мы определились, по каким атрибутам мы будем оценивать функцию, можно строить регрессионную модель.

5.2 Задача регрессии.

Решив задачу регрессии, получим результаты. Тут они не приводятся, в виду большого числа атрибутов. Приведем соответствующие невязки:

Видно, что тут погрешности на порядок выше. Это обусловлено «сильной» нелинейностью функции f. Приведем соответствующие погрешности для данного примера:

И достоверность предсказания.

Видно, что метод показал достаточно точные результаты на не линейных функциях!

6 Заключение и выводы

По результатам выполнения работы, средства Data Mining показали перспективность и состоятельность применения к задачам оценки количественных характеристик работ. Результаты, полученные на тестовых модельных данных, показали достаточную точность, чтобы считать средства Data mining пригодными для анализа проектов на основе накопленных данных, полученных с выполненных проектов.

Автор считает целесообразным продолжить исследования по данной тематике, в частности, с использованием реальных данных по проектам, в рамках магистерской работы. Также дальнейшие исследования должны включать вопросы:

· области применимости предложенного метода, выявлению ограничений данного подхода к оценке реальных проектов,

· анализу влияния «шума», всегда присутствующего в данных, характеризующих реальные проекты,

· чувствительности к изменению значений параметров (жесткость системы).

7 Список использованных источников и литературы

1. Руководство PMBOK®, 2004 Project Management Institute, Four Campus Boulevard, Newtown Square, PA 19073-3299 USA / США.

2. Manfred Bundschuh, Carol Dekkers, The IT Measurement Compendium.

3. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP – СПб.: БХВ-Петербург, 2008.

4. http://www.oracle.com/technology/documentation/datamining.html

5. Ньюэл Майкл В. Управление проектами для профессионалов. Руководство по подготовке к сдаче сертификационного экзамена – М.: КУДИЦ-ПРЕСС, 2008.

6. Хардман Р., МакЛафлин М. Oracle PL/SQL для профессионалов – М.: Лори, 2007.

Приложение А.

Таблица данных к примеру 1:


F

PREDICTION

df/f, %

ID

LOE1

LOE2

LOE3

LOE4

198

191.25

3.409

97

26

50

25

84

153

148.124

3.187

3

57

48

22

24

90

92.785

3.095

55

2

43

15

30

112

114.784

2.486

78

51

25

9

22

163

165.785

1.709

63

3

86

51

13

166

163.215

1.678

52

23

44

39

60

262

257.833

1.591

91

93

56

48

52

178

180.785

1.565

79

36

16

47

76

184

186.785

1.514

29

18

14

97

31

184

186.784

1.513

96

30

54

7

89

186

188.785

1.497

19

85

50

43

8

190

192.785

1.466

76

103

63

5

4

197

199.785

1.414

38

48

67

31

51

198

200.785

1.407

59

108

13

4

56

200

202.786

1.393

39

6

52

3

115

201

203.786

1.386

68

6

26

57

102

201

198.215

1.386

13

20

21

88

63

207

209.785

1.345

62

7

17

114

47

230

232.785

1.211

48

111

22

85

8

229

226.26

1.196

67

57

31

22

104

237

239.784

1.175

27

92

37

82

26

238

240.784

1.17

9

91

42

31

71

241

238.215

1.155

71

27

28

13

136

245

247.785

1.137

95

134

8

50

28

242

239.256

1.134

7

45

94

36

56

248

250.784

1.123

20

110

4

121

13

249

246.216

1.118

44

37

45

15

128

255

252.215

1.092

42

38

34

61

106

256

258.785

1.088

14

57

9

11

145

257

259.784

1.083

41

37

71

92

57

257

254.216

1.083

22

8

25

87

128

259

256.216

1.075

93

115

34

74

24

261

258.216

1.067

73

68

43

102

37

262

264.785

1.063

81

39

117

92

14

264

261.214

1.055

53

28

51

120

45

248

250.607

1.051

32

69

19

108

48

266

268.785

1.047

58

19

78

127

26

279

276.214

0.998

94

65

6

149

39

285

282.215

0.977

85

35

84

26

127

290

292.785

0.96

4

86

9

60

135

294

291.216

0.947

82

15

100

32

139

293

290.229

0.946

36

65

17

57

140

301

298.215

0.925

21

31

71

121

77

301

303.785

0.925

28

30

120

56

95

261

263.409

0.923

84

40

143

48

6

302

299.215

0.922

24

123

24

127

28

308

305.216

0.904

10

108

17

37

141

182

180.358

0.902

65

46

41

29

64

311

313.784

0.895

23

129

32

87

57

312

309.214

0.893

2

66

112

68

54

F

PREDICTION

df/f, %

ID

LOE1

LOE2

LOE3

LOE4

319

316.216

0.873

17

144

44

77

32

322

324.785

0.865

45

127

101

47

40

322

324.786

0.865

60

88

66

56

108

324

321.216

0.859

75

109

63

76

63

325

327.784

0.857

70

107

98

59

58

333

335.784

0.836

74

142

69

87

29

335

332.216

0.831

80

66

112

77

67

344

341.215

0.81

40

149

81

41

50

349

351.784

0.798

98

132

72

102

43

350

352.784

0.796

57

55

121

68

106

363

365.784

0.767

16

70

91

114

86

366

363.215

0.761

90

140

50

72

95

370

367.215

0.753

83

37

148

112

73

374

371.216

0.744

18

100

86

129

59

380

377.216

0.733

35

148

84

85

51

382

379.215

0.729

12

136

146

56

44

225

223.382

0.719

69

47

55

73

44

390

387.216

0.714

11

94

52

101

143

284

285.985

0.699

34

47

77

40

110

420

417.216

0.663

72

73

125

138

83

420

417.216

0.663

64

66

90

106

150

432

429.215

0.645

26

149

123

94

66

307

305.055

0.634

77

71

121

59

43

450

447.215

0.619

66

106

120

86

138

200

201.231

0.616

86

38

55

26

77

477

474.216

0.584

46

130

135

104

108

240

238.623

0.574

6

21

18

88

107

325

323.144

0.571

30

147

65

98

15

282

283.49

0.528

51

90

145

10

19

278

276.552

0.521

15

101

29

115

28

269

270.32

0.491

5

4

141

27

83

281

282.27

0.452

61

126

53

29

55

292

293.252

0.429

88

92

3

53

144

291

289.845

0.397

99

137

36

77

23

291

290.081

0.316

25

139

28

52

44

325

325.98

0.302

8

73

149

87

15

308

307.108

0.29

92

144

39

27

76

358

357.043

0.267

87

62

123

71

94

345

344.099

0.261

47

132

51

83

65

237

236.462

0.227

31

7

66

7

131

292

292.476

0.163

43

138

28

49

51

259

259.418

0.162

1

18

43

113

84

292

292.459

0.157

56

114

44

57

62

264

263.898

0.039

89

47

4

137

65

209

209.075

0.036

37

103

10

29

56

277

276.942

0.021

50

104

55

66

42



Таблица данных к примеру 2.