Обработка результатов экспериментов и наблюдений (стр. 6 из 10)

Проверить нужно нулевую гипотезу, в соответствии с которой М(х) = 10, против альтернативы ( в данном случае единственной ) М(х) = 11. Конкурирующую гипотезу обозначим Н₁. Тогда Н_о: М(х) = 10; Н₁: М(х) = 11.

Необходимо по результатам выборки определить в каком из состояний работает станок. Примем объем выборки n из потенциально бесконечной генеральной совокупности. В качестве контрольной величины возьмем выборочное среднее Х_n. На рис. 9 изображены плотности распределения Х_n для n = 25 и n = 4.

Для формулировки критерия необходимо разделить область изменения контрольной величины (х) на критическую область отклонения гипотезы Н_о ( принятия Н₁ ) и область принятия гипотезы Н_о. Для этого необходимо выбрать число К, такое, что 10 < К < 11, и интервал ( -¥; К ] рассматривать как область принятия гипотезы Н_о, а интервал [ К; ¥ ) - как область отклонения гипотезы Н_о. По рис. 9 видно, что каждая реализация Х₂₅ или Х₄ возможна при верности любой из двух гипотез, но с различной вероятностью. На рис. 9 указаны вероятности совершения ошибки первого

Рис. 9. Плотности распределения двух гипотез при различном

объеме выборки и одинаковой дисперсии

рода a ( отклонения верной гипотезы Н_о ) и второго рода b ( принятие гипотезы Н_о, когда она не верна ). По рис. 9 также видно, что увеличение n ведет к уменьшению дисперсии распределения х и тем самым - к одновременному уменьшению вероятностей a и b. В соответствии с рис. 9 можно записать:

;

Эти два уравнения содержат четыре величины a, b, К, n. Задав две из четырех величин, можно определить две другие.

Например, при n = 25 и К = 10,4 определим:

;

Если задаться величинами a и b, то можно определить величины К, n.

2.6. Проверка гипотезы вида закона распределения вероятностей

При проверке эксперимента закон распределения вероятностей случайных величин неизвестен и можно лишь предположительно судить о его виде . Выборочные оценки параметров распределения несут в себе случайные ошибки, искажающие истинный характер распределения. Поэтому после получения эмпирического распределения производится подбор теоретического закона распределения, пригодного для описания вероятностных свойств изучаемой случайной величины. Критерии подбора ( проверки гипотезы соответствия ) называют в статистике критериями согласия. Все они основаны на выборе допустимой меры расхождения между теоретическим распределением и выборочными данными.

Общую процедуру проверки гипотезы закона распределения можно представить в следующей последовательности:

По опытным данным строится эмпирическая кривая распределения вероятностей;

Определяются параметры эмпирического распределения ( в соответствии с его видом );

Выдвигается одна или несколько гипотез о функции плотности исследуемой случайной величины, исходя из внешнего вида эмпирической кривой, значений ее параметров, технических факторов, влияющих на ее вид;

Эмпирическая кривая выравнивается по одной или нескольким теоретическим кривым;

Проводится сравнение по одному или нескольким критериям согласия;

Выбирается теоретическая функция, дающая наилучшее согласование.

Поясним п. 4; 5. Определив по эмпирическим данным параметры распределения, подставляют их в теоретическую кривую закона распределения и рассчитывают вероятность середин интервалов эмпирического распределения. Умножив значение полученной вероятности на общее число опытов, получают теоретическое значение частот случайной величины, которые и определяют ²выровненную² кривую. Теперь можно найти вероятность того, что эмпирическая кривая соответствует выбранной теоретической, выбрав вероятность согласия ( уровень значимости ). Если результат расхождения не выйдет за принятый уровень значимости, то считают, что эмпирическое распределение согласуется с теоретическим. Если сравнение осуществляется с несколькими теоретическими законами, то окончательно принимать тот, который дает лучшее соответствие.

Чаще всего в качестве критериев согласия принимают критерий Пирсона ( c² ) и критерий Колмогорова - Смирнова ( К - С - критерий ).

Критерий c² является наиболее состоятельным при большом числе наблюдений. Он почти всегда опровергает неверную гипотезу, обеспечивает минимальную ошибку в принятии неверной гипотезы по сравнению

с другими критериями.

c² = ,

где m_j- наблюдаемая частота случайного события;

m^*_j - ожидаемая по принятому теоретическому закону распределения;

К - число интервалов случайной величины.

Затем определяется число степеней свободы l:

l = К - r - 1;

где К - число интервалов случайной величины;

r - число параметров теоретической функции распределения.

К - С - критерий лучше всего использовать в случае, если теоретические значения параметров распределения известны. При неизвестных параметрах его можно использовать, но он дает несколько завышенные результаты. При использовании этого критерия определяется величина

где

m^н_j, m*^н_j - соответственно, накопленные наблюдаемые и ожидаемые

(теоретические) частоты;

n - число проведенных опытов.

То есть, в данном случае оценивается только максимальное отклонение накопленной частоты случайного события, возникающее в одном из диапазонов изменения случайной величины. Полученное значение коэффициента сравнивается с табличным для числа степеней свободы опыта и принятого уровня значимости результата. Если табличное значение коэффициента больше, то гипотеза о принятом законе распределения не отвергается.

Контрольные вопросы

Сущность непрерывной и дискретной случайной величины;

Сущность интегрального закона распределения случайной величины;

Сущность дифференциального закона распределения случайной величины;

Связь интегрального и дифференциального законов распределения;

Основные характеристики случайной величины, заданной своим распределением;

Назовите примеры законов распределения непрерывной и дискретной случайной величины;

Понятие статистической гипотезы и статистического критерия;

Назовите примеры статистических гипотез;

Сущность ошибок первого и второго рода;

Сущность проверки гипотезы вида закона распределения;

Принципиальное различие в критериях Пирсона и Колмогорова - Смирнова.

НАХОЖДЕНИЕ ИНТЕРПОЛИРУЮЩИХ КРИВЫХ

В первой части пособия рассматривались измерения той или иной физической величины, находящейся при проведении серии измерений в неизменном состоянии. Очень часто исследуемая величина меняется в соответствии с изменением условий опыта или времени. Цель эксперимента в этом случае состоит в нахождении функциональной зависимости, которая наилучшим образом описывает изменение интересующего нас параметра.

Следует понимать, что однозначно восстановить ( большей частью неизвестную ) функциональную зависимость между переменными невозможно даже в том случае, если бы переменные величины, полученные из опыта, не имели бы ошибки измерения. Тем более не следует ожидать, что это удастся сделать, имея экспериментальные данные, содержащие, по крайней мере, случайные ошибки измерений.

Поэтому математическая обработка результатов наблюдений не может ставить перед собой задачу разгадать истинный характер зависимости между переменными. Она позволяет лишь представить результаты опыта в виде наиболее простой формулы.

В зависимости от назначения этих формул существуют различные методы их получения, отличающиеся сложностью расчетных процедур и точностью получаемых решений.

Графический метод обработки результатов

Графический метод заключается в построении графика зависимости между исследуемыми величинами с последующим определением уравнения зависимости между ними.

Графики строят прежде всего в равномерных шкалах. Если характер связи между исследуемыми величинами неизвестен, то сначала проверяют совпадение экспериментальных точек с заданной кривой. Если предварительные сведения о характере уравнения отсутствуют, то первым этапом обработки данных является нахождение кривой, совпадающей с опытными точками. Эта задача решается методом подбора. Можно использовать эталон - кальку с предварительно вычерченным на ней семейством кривых с различными параметрами. Естественно, что масштаб кальки и эмпирической кривой должен быть одинаков.

Построенный по опытным данным отрезок кривой может совпадать с большим количеством различных кривых, проходящих достаточно близко к опытным точкам. В этом случае выбирают кривую с наиболее простым и удобным в использовании уравнением. Иногда эмпирическая кривая может иметь перегибы или состоять из отдельных ярко выраженных участков. Однако при этом необходимо определить координаты точек перехода от одной кривой к другой.

Уравнение зависимости между исследуемыми величинами при графическом методе просто определяется тогда, когда эмпирические точки достаточно хорошо совпадают с прямой линией, т.е. описываются уравнением y = ax + b, где a, b - коэффициенты, подлежащие определению.

Определение коэффициентов при графическом методе основано на ²способе натянутой нити². Нанеся результаты эксперимента на график (лучше, если он выполнен на миллиметровке), подбираем графическую прямую, ближе всего подходящую к нанесенным точкам. Выбрав положение прямой, определяем две произвольные точки на этой прямой (не обязательно являющиеся точками эксперимента), определяем их координаты (x₁; y₁), (х₂; y₂). И для определения коэффициентов а и b получаем два простых уравнения

ах₁ + b = y₁;

ах₂ + b = y₂.

На рис. 10 приведена иллюстрация этого метода. Точки - результаты, полученные в эксперименте. Прямая проведена на глаз как можно ближе к экспериментальным точкам. На прямой выбраны точки М (2; 4) и N (13; 10). Коэффициент а характеризует угол наклона прямой.