Теория вероятностей (стр. 6 из 7)

Вопрос 40

Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр. Доверительный интервал – это интервал, который с заданной надежностью гамма покрывает заданный параметр. 1. Интервальной оценкой с надежностью гамма мат. ожидания а нормально распределенного количественного признака Х по выборочной средней Хв при известном среднем квадратическом отклонении сигма генеральной совокупности служит доверительный интервал: Хв – t(сигма/корень из n)<a<Хв+t(сигма/корень из n), где t(сигма/корень из n)=дельта – точность оценки, n – объем выборки, t – значение аргумента функции Лапласа Ф(t), при котором Ф(t)=гамма/2; при неизвестном сигма (и объеме выборки n<30) Хв – t гамма (s/корень из n)<a<Хв+t гамма (s/корень из n), где s-исправленное выборочное среднее квадратическое отклонение

Вопрос 41

Вопрос 42

В статистике рассматриваются гипотезы двух типов:

1. Параметрические – гипотезы о значении параметра известного распределения;

2. Непараметрические – гипотезы о виде распределения.

Обычно выделяют основную гипотезу – нулевую (H0). Пример: математическое ожидание признака x, который распределен по нормальному закону и дисперсия его известна, а H0: M(x) = a. Предполагаем, что известна дисперсия Конкурирующая гипотеза имеет вид: H1: M(x) ¹ a;

H1: M(x) > a, либо H1: M(x) = a1. Для проверки гипотез используются критерии, и они представляют собой специальным образом подобранные СВ, k – точечный или приближенный закон, который известен.

Обычно предполагается, что если гипотеза Н0 выполняется, то вычисляемая по выборочным данным kнабл. Этого критерия и гипотеза Н0 принимается, если kнабл.Î (kкритич. левостор.; kкритич. правостор.) Если kнабл. попадает в критическую область (все остальные значения k Î(- ¥ ; kкритич. лев.) È (kкритич. прав. ; ¥), то гипотеза Н0 отвергается и принимается конкурирующая гипотеза Н1. При этом возможны ошибки двух типов: Первого рода: что гипотеза Н0 отвергается, в то время, как она верна. Вероятность этой ошибки: P(H1/H0) = a - уровень значимости критерия. Критерий подбирается так, чтобы a была как можно меньше. Второго рода: что отвергается гипотеза Н1, в то время, как она верна. b = P(H0/H1) Мощностью критерия – (1-b) - вероятность попасть точке-выборке в критическое множество, когда верна конкурирующая гипотеза.

1-b = P(H1/H1)

Вопрос 43

Вопрос 44

По независимым выборкам, объемы которых n1, n2, извлеченным из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии s^2*xи s^2*y. Требуется сравнить эти дисперсии.

Правило I. Для того чтобы при заданном уровне значимости α, проверить нулевую гипотезу H_Q: D(X) = D(Y) о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе Ho:D(X) > D (Y), надо вычислить наблюдаемое значение критерия (отношение большей исправленной дисперсии к меньшей)

и по таблице критических точек распределения Фишера—Снедекора, по заданному уровню значимости а и числам степеней свободы k₁=n1—1, k₂ = n2—1 (k1—число степеней свободы большей исправленной дисперсии) найти критическую точку F_K_Р(a; k₁,k2). Если Fнабл < Fкр— нет оснований отвергнуть нулевую гипотезу. Если Fна,л > Fкр — нулевую гипотезу отвергают.

Правило 2. При конкурирующей гипотезе Н1: D(X)¹D(Y) критическую точку F_KP (α/2; k₁ ,k2) ищут по уровню значимости а/2 (вдвое меньшему заданного) и числам степеней свободы k1 и k₂(k1—число степеней свободы, большей дисперсии). Если F_H_АБЛ < Fкр — нет оснований отвергнуть нулевую гипотезу. Если Fнабл > Fкр — нулевую гипотезу отвергают.

Вопрос 45

Вопрос 46

Разобьем множество возможных значений случайной величины XHav разрядов (для непрерывной случайной величины роль разрядов играют интервалы значений, а для дискретной — отдел ь-ные возможные значения или их группы). Выдвинем нулевую гипотезу Н_о: F_x(x) = Fтеор(x) (состоящую в том, что генеральная совокупность распределена по закону Fтеор(x)) при альтернативной гипотезе Н1: F_x(x) ¹F_Teop(x). Одним из критериев согласия выборочного и теоретического распределений (т.е. критериев соответствия генеральной совокупности определенному закону распределения) является критерий X^2 (критерий Пирсона), который основывается на том, что распределение статистики

(где л, — число попаданий элементов выборки в i-й разряд, п - общее число элементов выборки, api^те^op— теоретическая вероятность попадания случайной величины Х в i-и разряд при условии истинности нулевой гипотезы) не зависит от выдвинутой гипотезы и определяется только числом степеней свободы k= v — l — 1, где v — число разрядов, аl— число оцениваемых параметров. Формулы закона распределения случайной величины X^2 довольно сложны, и мы их приводить не будем, но для этого распределения составлены таблицы значений X^2_k;_yтаких, что Р{X² < X^2_k;_y} = γ (табл. П. 3).

Если выбрать уровень значимости а, то надежность γ = 1 — а = — Р{X² < X^2_k;_y} и критическая область определяется неравенством X² набл< X^2_k;_y

Обратим внимание на то, что критерий Пирсона можно использовать только в том случае, когда nр^теор^³5, поэтому разряды, для кото-, рых это условие не выполняется, необходимо объединить с соседними.

Вопрос 47

С помощью методов регрессионного анализа строятся и проверяются модели, характеризующие связь между одной эндогенной (зависимой) переменной и одной или более экзогенными (независимыми) переменными. Независимые переменные называются регрессором.

Направленность связи между переменными определяется путем предварительного обоснования и включается в модель в качестве исходной гипотезы. Задача регрессионного анализа – проверка статистической состоятельности модели, если данная гипотеза верна. Регрессионный анализ не в состоянии «доказать» гипотезу, он может лишь подтвердить ее статистически или отвергнуть.

Метод наименьших квадратов (МНК, англ. Ordinary Least Squares, OLS) является одним из основных методов определения параметров регрессионных уравнений, дающий наилучшие линейные несмещенные оценки (теорема Гаусса–Маркова).

Метод наименьших квадратов заключается в том, чтобы определить вид кривой, характер которой в наибольшей степени соответствует эмпирическим данным. Такая кривая должна обеспечить наименьшее значение суммы квадратов отклонений эмпирических значений величин показателя от значений, вычисленных согласно уравнению этой кривой:

Уравнение линейной регрессии. Обычно признак Y рассматривается как функция многих аргументов — x₁, x₂, x₃, ...— и может быть записана в виде:

y = a + bx₁ + cx₂ + dx₃ + ... ,

где: а, b, с и d — параметры уравнения, определяющие соотношение между аргументами и функцией. В практике учитываются не все, а лишь некоторые аргументы, в простейшем случае, как при описании линейной регрессии, — всего один: y = a + bx
В этом уравнении параметр а — свободный член; графически он представляет отрезок ординаты (у) в системе прямоугольных координат. Параметр b называется коэффициентом регрессии. С точки зрения аналитической геометрии b— угловой коэффициент, определяющий наклон линии регрессии по отношению к осям, координат. В области регрессионного анализа этот параметр показывает, насколько в среднем величина одного признака (Y) изменяется при изменении на единицу меры другого корреляционно связанного с Y признака X.

Коэффициенты уравнения парной линейной регрессии. В случае линейной зависимости уравнение регрессии является уравнением прямой линии. Таких уравнений два: Y = a₁ + b_y/xX — прямое и X = a₂ + b_x/yY — обратное, где: a и b – коэффициенты, или параметры, которые надлежит определить.
Значение коэффициентов регрессии вычисляется по формуле:

Коэффициенты регрессии b имеют размерность, равную отношению размерностей изучаемых показателей X и Y, и тот же знак, что и коэффициент корреляции.
Коэффициенты а определяются по формуле: