29.Корреляционный момент, коэффициент корреляции.
Корреляционным моментом СВ x и h называется мат. ожидание произведения отклонений этих СВ. m x h =М((x —М(x ))*(h —М(h )))
Для вычисления корреляционного момента может быть использована формула:
m x h =М(x *h )—М(x )*М(h ) Доказательство: По определению m x h =М((x —М(x ))*(h —М(h ))) По свойству мат. ожидания
m x h =М(x h —М(h )—h М(x )+М(x )*М(h ))=М(x h )—М(h )*М(x )—М(x )*М(h )+М(x )*М(h )=М(x h )—М(x )*(h )
Предполагая, что x и h независимые СВ, тогда m x h =М(x h )—М(x )*М(h )=М(x )*М(h )—М(x )*М(h )=0; m x h =0. Можно доказать, что если корреляционный момент=0, то СВ могут быть как зависимыми, так и независимыми. Если m x h не равен 0, то СВ x и h зависимы. Если СВ x и h зависимы, то корреляционный момент может быть равным 0 и не равным 0. Можно показать, что корреляционный момент характеризует степень линейной зависимости между составляющими x и h . При этом корреляционный момент зависит от размерности самих СВ. Чтобы сделать характеристику линейной связи x и h независимой от размерностей СВ x и h , вводится коэффициент корреляции:
Кx h =m x h /s (x )*s (h ) Коэффициент корреляции не зависит от разностей СВ x и h и только показывает степень линейной зависимости между x и h , обусловленную только вероятностными свойствами x и h . Коэффициент корреляции определяет наклон прямой на графике в системе координат (x ,h ) Свойства коэффициента корреляции.
-1<=Кx h <=1
Если Кx h =± 1, то линейная зависимость между x и h и они не СВ.
Кx h >0, то с ростом одной составляющей, вторая также в среднем растет.
Кx h <0, то с убыванием одной составляющей, вторая в среднем убывает.
D(x ± h )=D(x )+D(h )± 2m x h
Доказательство.
D(x ± h )=M((x ± h )2)—M2(x ± h )=M(x 2± 2x h +h 2)—(M(x )± M(h ))2=M(x 2)± 2M(x h )+M(h 2)—+M2(x )+2M(x )*M(h )—M2(h )=D(x )+D(h )± 2(M(x h ))—M(x )*M(h )=D(x )+D(h )± 2m x h
30.Предмет математической статистики. Генеральная совокупность и выборка.
Мат. статистика опирается на теорию вероятностей, и ее цель – оценить характеристики генеральной совокупности по выборочным данным. Генеральной совокупностью называется вероятностное пространство {омега,S,P} (т.е. пространство элементарных событий омега с заданным на нем полем событий S и вероятностями Р) и определенная на этом пространстве С.В. Х. Случайной выборкой или просто выборкой объема n называется последовательность Х1,Х2,…,Xn, n независимых одинаково распределенных С.В., распределение каждой из которых совпадает с распределением исследуемой С.В. Х. Иными словами, случайная выборка – это результат n последовательных и независимых наблюдений над С.В. Х, представляющей генеральную совокупность.
31.Выборочное оценивание функции распределения и гистограмма.
Наиболее полная характеристика С.В. – это ее Ф.Р. Пусть х1,х2,…,xn – выборка из генеральной совокупности, представленной С.В. Х. Рассмотрим, как оценить Ф.Р. F(x) этой С.В., о которой известно только, что она непрерывна. Чтобы построить оценку F^n(x) Ф.Р. F(x), обычно располагают наблюдения xi в порядке их возрастания, т.е. находят вначале X*1=minXi, затем следующее по величине наблюдаемое значение и т.д.; если есть одинаковые значения, то их расположение не играет никакой роли. Последовательность неубывающих величин Х*1<=X*2<=X*n, полученных после упорядочения выборки, называется вариационным рядом. Существует статистическое и эмпирическое распределение. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению ni/h (плотность частоты), где ni – сумма частот вариант попавших в i-ый интервал.
32.Точечные оценки числовых характеристик. Основные определения. Метод моментов.
Статистической оценкой K * неизвестного параметра K теоретического распределения называют функцию f(X1,X2,…,Xn) от наблюдаемых С.В. X1,X2,…,Xn. Точечной называют статистическую оценку, которая определяется одним числом K *=f(x1,x2,…,xn), где х1,х2,…,xn – результаты n наблюдений над количественным признаком Х (выборка). Несмещенной называют точечную оценку, мат. ожидание которой равно оцениваемому параметру при любом объеме выборки. Смещенной называют точечную оценку, мат. ожидание которой не равно оцениваемому параметру. Несмещенной оценкой генеральной средней (мат. ожидания) служит выборочная средняя: Хв=(сумма по i от 1 до k nixi)/n, где xi – варианта выборки, ni – частота варианты xi, n=сумма по i от 1 до k ni – объем выборки. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия: Dв=(сумма по i от 1 до k ni(Хi-Xв)*2)/n. Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия: s*2=n/n-1*Dв=сумма ni(xj – Xв)*2/n-1. Метод моментов точечной оценки неизвестных параметров заданного распределения состоит в приравнивании теоретических моментов соответствующим эмпирическим моментам того же порядка. Если распределение определяется одним параметром, то для его отыскания приравнивают один теоретический момент одному эмпирическому моменту того же порядка. Например, можно приравнять начальный теоретический момент первого порядка начальному эмпирическому моменту первого порядка: v1=M1. Учитывая, что v1=M(X) и М1=Хв, получим М(Х)=Хв. Если распределение определяется двумя параметрами, то приравнивают два теоретических момента двум соответствующим эмпирическим моментам того же порядка. Учитывая, что v1=M(X),M1=Хв,мю=D(X),m2=Dв, имеем систему: М(Х)=Хв, D(X)=Dв.
33.Метод наибольшего правдоподобия.
Метод наибольшего правдоподобия точечной оценки неизвестных параметров заданного распределения сводится к отысканию максимума функции одного или нескольких оцениваемых параметров. Д.С.В. Пусть Х – Д.С.В., которая в результате n опытов приняла возможные значения х1,х2,…,xn. Допустим, что вид закона распределения величины Х задан, но неизвестен параметр K , которым определяется этот закон; требуется найти его точечную оценку K *=K (x1,x2,…,xn). Обозначим вероятность того, что в результате испытания величина Х примет значение xi через р(xi;K ). Функцией правдоподобия Д.С.В. Х называют функцию аргумента K : L (x1,x2,…,xn;K )=p(x1;K )*p(x2;K )…p(xn;K ). Оценкой наибольшего правдоподобия параметра K называют такое его значение K *, при котором функция правдоподобия достигает максимума. Функции L и lnL достигают максимума при одном и том же значении K , поэтому вместо отыскания максимума функции L ищут, что удобнее, максимум функции lnL. Н.С.В. Пусть Х – Н.С.В., которая в результате n испытаний приняла значения х1,х2,…,xn. Допустим, что вид плотности распределения – функции f(x) – задан, но неизвестен параметр K , которым определяется эта функция. Функцией правдоподобия Н.С.В. Х называют функцию аргумента K : L(x1,x2,…,xn;K )=f(x1;K )*f(x2;K )…f(xn;K ).
34.Интервальные оценки числовых характеристик. Доверительный интервал. Основные определения.
Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр. Доверительный интервал – это интервал, который с заданной надежностью гамма покрывает заданный параметр. 1. Интервальной оценкой с надежностью гамма мат. ожидания а нормально распределенного количественного признака Х по выборочной средней Хв при известном среднем квадратическом отклонении сигма генеральной совокупности служит доверительный интервал: Хв – t(сигма/корень из n)<a<Хв+t(сигма/корень из n), где t(сигма/корень из n)=дельта – точность оценки, n – объем выборки, t – значение аргумента функции Лапласа Ф(t), при котором Ф(t)=гамма/2; при неизвестном сигма (и объеме выборки n<30) Хв – t гамма (s/корень из n)<a<Хв+t гамма (s/корень из n), где s-исправленное выборочное среднее квадратическое отклонение. 2. Интервальной оценкой (с надежностью гамма) среднего квадратического отклонения сигма нормально распределенного количественного признака Х по “исправленному” выборочному среднему квадратическому отклонению s служит доверительный интервал s(1-q)<сигма<s(1+q), при q<1; 0<сигма<s(1+q), при q>1. 3. Интервальной оценкой ( с надежностью гамма) неизвестной вероятности р биномиального распределения по относительной частоте w служит доверительный интервал ( с приближенными концами р1 и р2).
35.Доверительный интервал для мат. ожидания при известной дисперсии.
K ^=X=1/n сумма по i от 1 до n Xi является наилучшей несмещенной оценкой для мат. ожидания МХ=K нормального распределения f(x,K )=1/(корень из 2пи сигма в квадрате)*е –(х-K )*2/(2сигма в квадрате) по выборке объема n. Пусть дисперсия Хi Dxi=сигма в квадрате известна, где сигма в квадрате – некоторое конкретное число. Предполагается, что для нормально распределенного признака x , дисперсия которого известна равна s 2. По выборке объема n получены выборочные значения x 1, x 2, ... , x n. Требуется получить интервальную оценку неизвестного нам математического ожидания этого признака. M |x | > a заданной надежности j. Сначала рассчитываем точечную оценку математического ожидания:
; Будем считать, что x 1, x 2, ... , x n разные СВ, но распределенные по одному и тому же закону и математическое ожидание.M(x i) = a; Д(x i) = s 2;
- значение СВ и тогда , тогда Доказательство несмещенности точечной оценки