Случайной величиной X называется величина, которая под влиянием случайных обстоятельств способна принимать различные значения.
Выборкой называется конечная совокупность результатов наблюдений X
, X , ... , X , представляющих собой независимые, одинаково распределенные случайные величины.Случайные величины описываются следующими характеристиками.
Математическим ожиданием дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности. Математическое ожидание приближенно равно среднему значению случайной величины, т.е. служит характеристикой среднего значения случайной величины.
Пусть случайная величина X может принимать только значения x1, x2,...,xn, вероятности которых соответственно равны p1, p2,...,pn . Тогда математическое ожидание M(X) случайной величины Х определяется равенством:
M(X) = x1p1 + x2p2 +…+ xnpn .
Если дискретная случайная величина Х принимает счетное множество возможных значений, то
,причем математическое ожидание существует, если ряд в правой части сходится абсолютно.
В данном случае М(X )= 9,1947, М(Y) = 30,8216.
Существуют также и другие характеристики случайной величины – это дисперсия и среднее квадратичное отклонение.
Для определения дисперсии случайной величины необходимо ввести понятие отклонения случайной величины от ее математического ожидания.
Пусть Х - случайная величина и М(Х) - ее математическое ожидание. Рассмотрим в качестве новой случайной величины разность (Х - М(Х)).
Отклонением называют разность между случайной величиной и ее математическим ожиданием.
При определении дисперсии используется следующее свойство отклонения:
.Это приводит к тому, что целесообразно заменить существующие отклонения их абсолютными значениями или их квадратами. Так и поступают. Правда, в случае, когда возможные отклонения заменяют их абсолютными значениями, приходится оперировать с абсолютными величинами, что иногда приводит к серьезным затруднениям. Поэтому чаще всего идут по другому пути, т.е. вычисляют среднее значение квадрата отклонения, которое и называется дисперсией.
Дисперсией случайной величины Х называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:
.В нашем случае
= 30,1964 , = 269,5502.Средним квадратическим отклонением случайной величины Х называют квадратный корень из дисперсии:
. =5,495125, =16,41798.Исправленная дисперсия :
S(x) = 30,50141, S(y) = 272,2729.
Выборочное исправленное среднее квадратическое отклонение:
= 5,522808, = 16,50069.Часто статистические данные дополняются графиками. Графики являются самой эффективной формой представления данных с точки зрения их восприятия. Статистические графики представляют собой условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Таким образом, облегчается рассмотрение статистических данных, они становятся наглядными, выразительными, обозримыми.
Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны частоте
.Гистограммой относительных частот называется диаграмма, на которой изображены столбцы, при этом ось Х — это интервалы, а ось У — это относительная частота встречаемости:
.Полигоном частот называют ломаную, отрезки которой соединяют точки
. Для построения полигона на оси абсцисс откладывают варианты , а на оси ординат соответствующие им частоты .Полигоном относительных частот называют ломаную, отрезки которой соединяют точки
. Для построения полигона на оси абсцисс откладывают варианты , а на оси ординат соответствующие им относительные частоты .Эмпирической функцией распределения (функцией распределения выборки) называют функцию
, определяющую для каждого значения относительную частоту события . По определению , где — число вариант, меньших ; n — объем выборки. Функция обладает теми же свойствами, что и вероятность.Нормальное распределение — приближённая плотность вероятности.
Плотность нормального распределения имеет вид:
а функция распределения
.Дана выборка (объема n=100), зависимости числа Y от числа X.
X | Y | X | Y |
15 | 49,4 | 8,98 | 30,5 |
0,212 | 5,46 | 10,6 | 34,5 |
17,9 | 57,2 | 16,8 | 53,3 |
7,68 | 26,9 | 2,7 | 11,6 |
18 | 56,5 | 7,58 | 25,9 |
14,9 | 48 | 12,3 | 40,4 |
13,4 | 43,3 | 4,06 | 16,5 |
0,358 | 4 | 0,244 | 5,02 |
0,994 | 7,23 | 4,86 | 17,7 |
9,78 | 31,2 | 9,48 | 31,4 |
5 | 18,3 | 15,7 | 50,9 |
6,68 | 24,1 | 13,5 | 41,8 |
17,7 | 57,3 | 16,6 | 52,7 |
1,99 | 8,87 | 12,1 | 38,6 |
19,7 | 61,4 | 15 | 49,6 |
7,16 | 23,9 | 12,2 | 41,2 |
10,8 | 37,1 | 8,06 | 28,1 |
0,652 | 6,42 | 17,6 | 56,4 |
9,72 | 32,4 | 19,7 | 62,7 |
12,6 | 40,1 | 9,98 | 34 |
4,78 | 15,9 | 16,4 | 50,9 |
1,36 | 7,43 | 17,8 | 54,7 |
4,94 | 17,2 | 5,42 | 17,4 |
12,3 | 38,8 | 6,98 | 22,4 |
4,64 | 17,4 | 5,98 | 19 |
Начнем изучение данных X и Y с построения диаграммы рассеивания:
Диаграмма рассеивания наглядно показывает тенденцию возрастания Y при возрастании Х. Это объясняется тем, что при увеличении количества рабочих дней, зарплата возрастает.
Теперь построим корреляционную таблицу. Разобьём значения x на 5 и y на 5 интервалов:
y\x | 2 | 6 | 10 | 14 | 18 | N(y) | P*(y) |
7 | 18 | 0 | 0 | 0 | 0 | 18 | 0,18 |
21 | 1 | 27 | 1 | 0 | 0 | 29 | 0,29 |
35 | 0 | 0 | 20 | 7 | 0 | 27 | 0,27 |
49 | 0 | 0 | 0 | 9 | 7 | 16 | 0,16 |
63 | 0 | 0 | 0 | 0 | 10 | 10 | 0,1 |
N(x) | 19 | 27 | 21 | 16 | 17 | 100 | |
P*(x) | 0,19 | 0,27 | 0,21 | 0,16 | 0,17 | 1 |
По корреляционной таблице найдём оценки для Х:
выборочное среднее —
, где : =9,4;выборочную дисперсию —
: =29,56;исправленную дисперсию —
: =36,95;среднеквадратичное отклонение —
: =5,436911;оценку среднеквадратичного отклонения —
: