Самостоятельная работа №4 на тему НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ». Выполнила Попова Татьяна, группа 324.
Непараметрические критерии – это критерии, не включающие в формулу расчёта параметров распределения и основанные на оперировании частотами или рангами.
U- критерий Манна-Уитни
Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1,n2≥ 3 или n1 =2, n2≥5.
Существует несколько способов использования критерия и несколько таблиц критических значений, соответствующих этим способам.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. (1-м рядом (выборкой, группой) называют тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом – тот, где они предположительно ниже.
Чем ниже область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше Uэмп, тем более веротно, что различия достоверны.
Ограничения критерия U.
1. В каждой выборке должно быть не менее 3 наблюдений: n1, n2≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.
2. В каждой выборке должно быть не более 60 наблюдений; n1, n2≤60. Однако уже при n1, n2 >20 ранжирование становится достаточно трудоёмким.
Критерий Uтребует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.
H- критерий Крускала-Уоллиса
Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.
Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.
Данный критерий является продолжением критерия U на большее, чем на 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и подсчитываются суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределяется между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой – высокие, а в третьей – средние, то критерий Hпозволит установить эти различия.
Т-критерий Вилкоксона
Критерий применяется для сопоставления показателей, измеренных в двух разных условиях на однойи той же выборке испытуемых.
Он позволяет установить не только направленность изменений, но и их выраженность. С его помощью определяется, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом.
Этот критерий применяется в тех случаях, когда признаки измерены по крайней мере по шкале порядка, и сдвиги между вторым и первым замерами тоже могут быть упорядочены. Для этого они должны варьировать в достаточно широком диапазоне. В принципе, можно применить критерий Т и в тех случаях, когда сдвиги принимают только три значения: -1, 0 и +1, но тогда критерий Т вряд ли добавит что-нибудь новое к тем выводам, которые можно было бы получить с помощью критерия знаков. Вот если сдвиги изменяются, например от -30 до +45, тогда имеет смысл их ранжировать и потом суммировать ранги.
Суть метода состоит в том, что сопоставляются выраженность сдвигов в том и ином направлениях по абсолютной величине. Для этого сначала ранжируются все абсолютные величины сдвигов, а потом суммируют ранги. Если сдвиги в положительную и в отрицательную сторону происходят случайно, то суммы рангов абсолютных значений их будут примерно равны. Если же интенсивность сдвига в одном из направлений перевешивает, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.
Первоначально исходят из предложения о том, что типичным сдвигом будет сдвиг в более часто встречающемся направлении, а нетипичным, или редким, сдвигом – сдвиг в более редко встречающемся направлении.
Критерий X2rФридмана
Критерий X2r применяется для сопоставления показателей, измеренных в трёхили более условиях на одной и той же выборке испытуемых.
Критерий позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений.
Данный критерий является распространением критерия Т Вилкоксона на большее, чем на 2, количество условий измерения. Однако здесь мы ранжируем не абсолютные величины сдвигов, а сами индивидуальные значения, полученные данным испытуемым в 1, 2, 3 и т. д. замерах.
После того, как все значения будут проранжированы, подсчитываются суммы рангов по столбцам для каждого из произведённых замеров.
Если различия между значениями признака, полученными в разных условиях, случайны, то суммы рангов по разным условиям будут приблизительно равны. Но если значения признака изменяются в разных условиях каким-то закономерным образом, то в одних условиях будут преобладать высокие ранги, а в других – низкие. Суммы рангов будут достоверно различаться между собой. Эмпирическое значение критерия X2rиуказывает на то, насколько различаются суммы рангов. Чем больше эмпирическое значение X2r, тем более существенные расхождения сумм рангов оно отражает.
Если X2r равняется критическому значению или превышает его, различия статистически достоверны.
λ - Критерий Колмогорова-Смирнова
Критерий предназначен для сопоставления двух распределений:
a) Эмпирического с теоретическим, например, равномерным или нормальным;
b) Одного эмпирического распределения с другим эмпирическим распределением.
Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.
Если в методе Х2 сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь сопоставляются сначала частоты по первому разряду, потом по сумме первого и второго разрядов и т.д. Таким образом, сопоставляются всякий раз накопленные к данному разряду частоты.
Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия λ включается эта разность. Чем больше эмпирическое значение λ, тем более существенны различия.
Критерий серий Вальда-Вольфовица устроен следующим образом. Представьте, что вы хотите сравнить мужчин и женщин по некоторому признаку. Вы можете упорядочить данные, например, по возрастанию, и найти те случаи, когда субъекты одного и того же пола примыкают друг к другу в построенном вариационном ряде (иными словами, образуют серию). Если нет различия между мужчинами и женщинами, то число и длина «серий», относящиеся к одному и тому же полу, будут более или менее случайными. В противном случае две группы (мужчины и женщины) отличаются друг от друга, то есть не являются однородными. Критерий предполагает, что рассматриваемые переменные являются непрерывными и измерены, по крайней мере, в порядковой шкале. Критерий серий Вальда—Вольфовица проверяет гипотезу о том, что две независимые выборки извлечены из двух популяций, которые в чем-то существенно различаются между собой, иными словами, различаются не только средними, но также формой распределения. Нулевая гипотеза состоит в том, что обе выборки извлечены из одной и той же популяции, то есть данные однородны.
Q -критерий Кохрена
Q-критерий Кохрена — это развитие критерия Макнемара. Критерий проверяет, значимо или нет различаются между собой несколько сравниваемых переменных, принимающих значения 0-1.
Медианный тест — это «грубая» версия критерия Крускала—Уоллиса. STATISTICA просто подсчитывает число наблюдений каждой выборки, которые попадают выше или ниже общей медианы выборок. При нулевой гипотезе (все выборки извлечены из популяций с равными медианами) ожидается, что примерно 50% всех наблюдений в каждой выборке попадают выше (или ниже) общей медианы. Медианный тест особенно полезен, когда шкала содержит искусственные границы, и многие наблюдения попадают в ту или иную крайнюю точку (оказываются «вне шкалы»).