3. Задаются некоторой функцией от результатов наблюдения (критической статистикой) γ(n)= γ (х1, х2,…, х3). Эта критическая статистика γ(n), как и всякая функция от результатов наблюдения, сама является случайной величиной и в предположении справедливости гипотезы Н0 подчинена некоторому хорошо изученному (затабулированному) закону распределения с плотностью f γ(n)(u).
4.Из таблиц распределения f γ(n)(u) находятся 100(1 - ά/2)%-ная точка γminά/2 и 100 ά/2%-ная точка γmaxά/2, разделяющие всю область мыслимых значений случайной величины γ(n) на три части: область неправдоподобно малых (I), неправдоподобно больших (III) и естественных или правдоподобных (в условиях справедливости гипотезы Н0) значений (II) (рис.1). В тех случаях, когда основную опасность для нашего утверждения представляют только односторонние отклонения, т.е. только «слишком маленькие» или только «слишком большие» значения критической статистики γ(n) находят лишь одну процентную точку: либо 100(1 -ά) %- ную точку γminά, которая будет разделять весь диапазон значений γ(n) на две части: область неправдоподобно малых и область правдоподобных значений; либо 100 ά %-ную точку γ(max)ά, она будет разделять весь диапазон значений γ(n) на область неправдоподобно больших и область правдоподобных значений.
5. В функцию γ(n) подставляют имеющиеся конкретные выборочные данные х1,...,х2 и подсчитывают численную величину γ(n). Если окажется, что вычисленное значение принадлежит области правдоподобных значении γ(n) то гипотеза Н0 считается не противоречащей выборочным данным. В противном случае, т. е. если γ(n) слишком мала или слишком велика, делается вывод, что γ(n) на самом деле не подчиняется закону f γ(n)(u), и это несоответствие мы вынуждены объяснить ошибочностью высказанного нами предположения Н0 и, следовательно, отказаться от него.
На разных стадиях статистического исследования и моделирования возникает необходимость в формулировке и экспериментальной проверке некоторых предположительных утверждений (гипотез) относительно природы или величины неизвестных параметров анализируемой стохастической системы. Например, исследователь высказывает предположение: «исследуемые наблюдения извлечены из нормальной генеральной совокупности» или «среднее значение анализируемой генеральной совокупности равно нулю».
Процедура обоснованного сопоставления высказанной гипотезы с имеющимися в нашем распоряжении выборочными данными х1,х2…хn, сопровождаемая количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.
Результат подобного сопоставления может быть либо отрицательным (данные наблюдения противоречат высказанной гипотезе, а потому от этой гипотезы следует отказаться), либо неотрицательным (данные наблюдения не противоречат высказанной гипотезе), а потому ее можно принять в качестве одного из естественных и допустимых решений. При этом неотрицательный результат статистической проверки гипотезы не означает, что высказанное нами предположительное утверждение является наилучшим, единственно подходящим: просто она не противоречит имеющимся у нас выборочным данным, однако таким же свойством могут наряду с H обладать и другие гипотезы.
По своему прикладному содержанию высказываемые в ходе статистической обработки данных гипотезы можно подразделить на несколько основных типов.
При обработке ряда наблюдений х1,х2…хn , (5)
исследуемой случайной величины ξ очень важно понять механизм формирования выборочных значений хi, т.е. подобрать и обосновать некоторую модельную функцию распределения Fмод(x), с помощью которой можно адекватно описать исследуемую функцию распределения Fξ(x). На определенной стадии исследования это приводит к необходимости проверки гипотез типа: (6)
где гипотетичная модельная функция может быть как заданной однозначно (тогда Fξ(x) = F0(x), где F0(x) - полностью известная функция), так и заданной с точностью до принадлежности к некоторому параметрическому семейству (тогда Fмод(x) = F(х;θ), где θ - некоторый, вообще говоря, к-мерный параметр, значения которого неизвестны, но могут быть оценены по выборке (5).
Проверка гипотез типа (6) осуществляется с помощью так называемых критериев согласия и опирается на ту или иную меру различия между анализируемой эмпирической функцией распределения Fξ(n)(x) и гипотетическим модельным законом Fмод(x).
Наиболее типичные задачи такого рода характеризуются следующей обшей ситуацией. Пусть мы имеем несколько «порций» выборочных данных типа(5):
(7)Эти порции могли образоваться, например, естественным образом - в ходе проведения выборочного обследования (скажем, за счет разделенности условий их регистрации во времени или пространстве). Обозначая функцию распределения, описывающую вероятностный закон, которому подчиняются наблюдения j-й выборки, с помощью Fj(x) и снабжая тем же индексом все интересующие нас эмпирические и теоретические характеристики этого закона (средние значения âj и аj; дисперсии σ2j и σ2j ).
В случае неотрицательного результата проверки этих гипотез говорят, что соответствующие выборочные характеристики (например, а1, а2,..,аi) различаются статистически незначимо.
Пусть, например, ряд наблюдений (5) дает нам значения некоторого параметра изделий, измеренные на n изделиях, случайно отобранных из массовой продукции определенного станка автоматической линии, и пусть а0 заданное номинальное значение этого параметра. Каждое отдельное значение хi - может, естественно, как-то отклоняться от заданного номинала. Очевидно, для того чтобы проверить правильность настройки этого станка, надо убедиться в том, что среднее значение параметра у производимых на нем изделий будет соответствовать номиналу, т. е. проверить гипотезу типа
(11)В общем случае гипотезы подобного типа имеют вид:
(12)где θ - некоторый параметр (многомерный), от которого зависит исследуемое распределение, а Δ0 - область его конкретных гипотетических значений, которая может состоять всего из одной точки.
Статистическая проверка гипотез о числовых значениях параметров играет важную роль в эконометрическом моделировании, регрессионном анализе, в широком спектре задач статистического исследования зависимостей, существующих между анализируемыми показателями. В частности, принятие решения о включении или исключении той или иной переменной в анализируемую регрессионную (эконометрическую) модель, о наличии-отсутствии статистической связи между наблюдаемыми признаками существенно опирается обычно на проверку гипотез типа (12) при Δ0= 0.
На основании проделанной работы можно сделать следующие выводы.
Вероятность любого события А определяется как сумма вероятностей всех элементарных событий, составляющих событие.
Априорный подход к вычислению вероятностей P{wi} заключается в теоретическом, умозрительном анализе специфических условий данного конкретного случайного эксперимента. Вероятность события в данном классе ситуаций может быть определена как отношение числа благоприятных исходов (т. е. элементарных исходов, входящих в это событие) к числу всех возможных исходов (так называемое классическое определение вероятности).
В соответствии с апостериорно-частотным подходом, вероятность Р{wi} определяется как предел относительной частоты появления исхода в процессе неограниченного увеличения общего числа случайных экспериментов n.