Министерство образования и науки Российской Федерации
Государственное образовательное учреждение высшего
профессионального образования
«Санкт-Петербургский государственный
политехнический университет»
Факультет экономики и менеджмента
Кафедра «Предпринимательство и коммерция»
КУРСОВОЙ ПРОЕКТ
по дисциплине «Статистика»
на тему «Статистический анализ рядов распределения. Проверка гипотезы о законе распределения»
Выполнил____________
(подпись)
Принял:Магистр коммерции
____________
(подпись)
«__» _________ 2010 г.
Санкт-Петербург
2010
ДАННЫЕ, ВАРИАЦИОННЫЙ РЯД, РАНЖИРОВАНИЕ, ВЫБРОСЫ, ГИСТОГРАММА, ПОЛИГОН, КУМУЛЯТА, ИНТЕРВАЛЬНЫЕ РЯДЫ , СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ, СГЛАЖИВАНИЕ ИМПЕРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ, ГИПОТЕЗА
В курсовом проекте рассмотрена реализация анализа распределений с использованием программы STATISTICA, а также произведены расчеты основных статистических показателей.
СОДЕРЖАНИЕ
Введение…………………………………………………………………стр.4
1. Табличное и графическое представление вариационного ряда распределения………………………………………………………стр.5
2. Расчет основных характеристик вариационного ряда………...стр.17
3. Сглаживание эмпирического распределения, проверка гипотезы о законе распределения……………………………………………...стр.21
Заключение………………………………………………...……………стр.25
Список использованных источников…………………………………..стр.26
Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени.
Ряды распределения могут быть вариационным, если они строятся на основе количественного признака, или атрибутивным, если они строятся на основе атрибутивного признака.
Изучение вариационных рядов распределения позволяет: определить типический уровень признака в изучаемой совокупности; определить наличие выбросов и решить вопрос о необходимости их самостоятельного изучения; оценить степень разброса значений признака вокруг типического уровня; изучить структуру совокупности; охарактеризовать форму распределения, а также подобрать теоретическое распределение, на основе которого можно моделировать поведение распределения изучаемой совокупности.
На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований. Таким образом статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.
Ряды распределения могут быть представлены в табличной форме и графически.
Целью проекта является освоение методики и приобретение практических навыков анализа распределений, включающего расчет основных статистических характеристик, графическое и табличное представление рядов распределения.
В курсовом проекте рассматривается реализация анализа распределений с использованием программы STATISTICA.
STATISTICA – это универсальная интегрированная система, предназначенная для статистического анализа и визуализации данных, управления базами данных и разработки пользовательских приложений, содержащая широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе, а также специальные методы добычи данных.
1. Табличное и графическое представление
вариационного ряда
Проект выполнен на основе исследования данных о числе собственных легковых автомобилей на 1000 человек по различным округам, республикам, краям в 2001 году.
Исходные данные приведены в Табл. 1.1.
Табл.1.1
Число собственных легковых автомобилей
на 1000 человек в 2001г.
Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей |
1 | 147 | 16 | 122,2 | 31 | 46,6 | 46 | 110,1 | 61 | 158,6 | 76 | 115,4 |
2 | 62,1 | 17 | 100,3 | 32 | 56,4 | 47 | 118,5 | 62 | 132,3 | 77 | 114,1 |
3 | 112,8 | 18 | 197 | 33 | 96,6 | 48 | 68,3 | 63 | 112,5 | 78 | 120,2 |
4 | 172,9 | 19 | 166 | 34 | 118,3 | 49 | 107 | 64 | 81,7 | 79 | 115,1 |
5 | 93,8 | 20 | 115,7 | 35 | 104,9 | 50 | 97,9 | 65 | 94,1 | 80 | 187,7 |
6 | 121 | 21 | 92,7 | 36 | 115,6 | 51 | 112,8 | 66 | 166 | 81 | 134,6 |
7 | 105 | 22 | 69,7 | 37 | 34,4 | 52 | 150,8 | 67 | 126,1 | 82 | 150,7 |
8 | 114,7 | 23 | 121 | 38 | 172 | 53 | 107,5 | 68 | 120,5 | 83 | 197,7 |
9 | 132,7 | 24 | 216,9 | 39 | 136,8 | 54 | 165,4 | 69 | 50,4 | 84 | 19,6 |
10 | 183,4 | 25 | 141,4 | 40 | 119,3 | 55 | 129,5 | 70 | 10,8 | 85 | 173,1 |
11 | 119,8 | 26 | 149,7 | 41 | 131,2 | 56 | 122,8 | 71 | 140 | 86 | 196 |
12 | 119 | 27 | 106,2 | 42 | 142,8 | 57 | 122 | 72 | 34 | 87 | 124,9 |
13 | 107,4 | 28 | 127,7 | 43 | 134 | 58 | 104,3 | 73 | 117,4 | 88 | 20,8 |
14 | 135,4 | 29 | 168,1 | 44 | 86,7 | 59 | 180,4 | 74 | 94,8 | ||
15 | 133,8 | 30 | 147,6 | 45 | 85,7 | 60 | 113,2 | 75 | 130,7 |
Построение ряда распределения начинается с ранжирования ряда распределения по величине соответствующего признака. Ранжирование – это расположение единиц совокупности в порядке возрастания или убывания значений признака. Для этого выбираем в меню Data опцию Sort. Далее в поле Direction выбираем тип сортировки – по возрастанию значений признака (Ascending). Получим значения признака, упорядоченные по возрастанию (см. Табл.1.2). Построение ранжированного ряда позволяет увидеть наличие в совокупности выбросов. Выбросы - значения признака, резко отличающиеся в меньшую или большую сторону от основной массы значений признака.
Табл. 1.2
Исходные данные, ранжированные по возрастанию значений признака
Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей |
1 | 10,8 | 16 | 93,8 | 31 | 112,8 | 46 | 120,2 | 61 | 133,8 | 76 | 166 |
2 | 19,6 | 17 | 94,1 | 32 | 112,8 | 47 | 120,5 | 62 | 134 | 77 | 166 |
3 | 20,8 | 18 | 94,8 | 33 | 113,2 | 48 | 121 | 63 | 134,6 | 78 | 168,1 |
4 | 34 | 19 | 96,6 | 34 | 114,1 | 49 | 121 | 64 | 135,4 | 79 | 172 |
5 | 34,4 | 20 | 97,9 | 35 | 114,7 | 50 | 122 | 65 | 136,8 | 80 | 172,9 |
6 | 46,6 | 21 | 100,3 | 36 | 115,1 | 51 | 122,2 | 66 | 140 | 81 | 173,1 |
7 | 50,4 | 22 | 104,3 | 37 | 115,4 | 52 | 122,8 | 67 | 141,4 | 82 | 180,4 |
8 | 56,4 | 23 | 104,9 | 38 | 115,6 | 53 | 124,9 | 68 | 142,8 | 83 | 183,4 |
9 | 62,1 | 24 | 105 | 39 | 115,7 | 54 | 126,1 | 69 | 147 | 84 | 187,7 |
10 | 68,3 | 25 | 106,2 | 40 | 117,4 | 55 | 127,7 | 70 | 147,6 | 85 | 196 |
11 | 69,7 | 26 | 107 | 41 | 118,3 | 56 | 129,5 | 71 | 149,7 | 86 | 197 |
12 | 81,7 | 27 | 107,4 | 42 | 118,5 | 57 | 130,7 | 72 | 150,7 | 87 | 197,7 |
13 | 85,7 | 28 | 107,5 | 43 | 119 | 58 | 131,2 | 73 | 150,8 | 88 | 216,9 |
14 | 86,7 | 29 | 110,1 | 44 | 119,3 | 59 | 132,3 | 74 | 158,6 | ||
15 | 92,7 | 30 | 112,5 | 45 | 119,8 | 60 | 132,7 | 75 | 165,4 |
В данной совокупности выбросами являются значения регионов под номерами 1, 2, 3, 88, т.е. данные 10,8; 19,6; 20,8 и 216,9 резко отличаются от основной части значений признака. Поэтому при анализе совокупности в дальнейшем исключим эти значения признака. Каждое из них выделяется и стирается простым нажатием кнопки Delete на клавиатуре. Также удаление значений (выбросов) из ячеек, можно провести как удаление наблюдений, то есть строк. В итоге изучаемая совокупность будет состоять из 84 значений признака (см.Табл.1.3).
Табл.1.3
Исходные данные за исключением выбросов,
ранжированные по возрастанию значений признака
Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей | Номер региона | Число легковых автомобилей |
1 | 34 | 16 | 96,6 | 31 | 114,1 | 46 | 121 | 61 | 135,4 | 76 | 172 |
2 | 34,4 | 17 | 97,9 | 32 | 114,7 | 47 | 122 | 62 | 136,8 | 77 | 172,9 |
3 | 46,6 | 18 | 100,3 | 33 | 115,1 | 48 | 122,2 | 63 | 140 | 78 | 173,1 |
4 | 50,4 | 19 | 104,3 | 34 | 115,4 | 49 | 122,8 | 64 | 141,4 | 79 | 180,4 |
5 | 56,4 | 20 | 104,9 | 35 | 115,6 | 50 | 124,9 | 65 | 142,8 | 80 | 183,4 |
6 | 62,1 | 21 | 105 | 36 | 115,7 | 51 | 126,1 | 66 | 147 | 81 | 187,7 |
7 | 68,3 | 22 | 106,2 | 37 | 117,4 | 52 | 127,7 | 67 | 147,6 | 82 | 196 |
8 | 69,7 | 23 | 107 | 38 | 118,3 | 53 | 129,5 | 68 | 149,7 | 83 | 197 |
9 | 81,7 | 24 | 107,4 | 39 | 118,5 | 54 | 130,7 | 69 | 150,7 | 84 | 197,7 |
10 | 85,7 | 25 | 107,5 | 40 | 119 | 55 | 131,2 | 70 | 150,8 | ||
11 | 86,7 | 26 | 110,1 | 41 | 119,3 | 56 | 132,3 | 71 | 158,6 | ||
12 | 92,7 | 27 | 112,5 | 42 | 119,8 | 57 | 132,7 | 72 | 165,4 | ||
13 | 93,8 | 28 | 112,8 | 43 | 120,2 | 58 | 133,8 | 73 | 166 | ||
14 | 94,1 | 29 | 112,8 | 44 | 120,5 | 59 | 134 | 74 | 166 | ||
15 | 94,8 | 30 | 113,2 | 45 | 121 | 60 | 134,6 | 75 | 168,1 |
Вариационным называется ряд распределения, построенный по количественному признаку. Он может быть представлен в виде таблицы и графически. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.