Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.
Нулевая гипотеза - это гипотеза об отсутствии различий.
Она обозначается как H0 и называется нулевой потому, что содержит число 0: X1—X2=0, где X1, Х2 - сопоставляемые значения признаков.
Нулевая гипотеза - это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий..
Альтернативная гипотеза - это гипотеза о значимости различий. Она обозначается как H1. Альтернативная гипотеза - это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой
Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности задания, или что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам. Однако чаще нам все-таки требуется доказать значимость различий, ибо они более информативны для нас в поиске нового. Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.
Направленные гипотезы
H0: X1 не превышает Х2
H1: X1 превышает Х2
Ненаправленные гипотезы
H0: X1 не отличается от Х2
Н1: Х2 отличается от Х2
Если вы заметили, что в одной из групп индивидуальные значения испытуемых по какому-либо признаку, например по социальной смелости, выше, а в другой ниже, то для проверки значимости этих различий нам необходимо сформулировать направленные гипотезы.
Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, чем в группе Б, то нам тоже необходимо сформулировать направленные гипотезы.
Если же мы хотим доказать, что различаются формы распределения признака в группе А и Б, то формулируются ненаправленные гипотезы.
При описании каждого критерия в руководстве даны формулировки гипотез, которые он помогает нам проверить.
Построим схему - классификацию статистических гипотез.
Проверка гипотез осуществляется с помощью критериев статистической оценки различий.
Q – критерий Розенбаума
Назначение критерия
Критерий используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.
Описание критерия
Это очень простой непараметрический критерий, который позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Однако если критерий Q не выявляет достоверных различий, это еще не означает, что их действительно нет.
В этом случае стоит применить критерий ф* Фишера. Если же Q-критерий выявляет достоверные различия между выборками с уровнем значимости р <=0,01, можно ограничиться только им и избежать трудностей применения других критериев.
Критерий применяется в тех случаях, когда данные представлены по крайней мере в порядковой шкале. Признак должен варьировать в каком-то диапазоне значений, иначе сопоставления с помощью Q -критерия просто невозможны. Например, если у нас только 3 значения признака, 1, 2 и 3, - нам очень трудно будет установить различия. Метод Розенбаума требует, следовательно, достаточно тонко измеренных признаков.
Применение критерия начинаем с того, что упорядочиваем значения признака в обеих выборках по нарастанию (или убыванию) признака. Лучше всего, если данные каждого испытуемого представлены на отдельной карточке. Тогда ничего не стоит упорядочить два ряда значений по интересующему нас признаку, раскладывая карточки на столе. Так мы сразу увидим, совпадают ли диапазоны значений, и если нет, то насколько один ряд значений "выше" (S1), а второй - "ниже" (S2). Для того, чтобы не запутаться, в этом и во многих других критериях рекомендуется первым рядом (выборкой, группой) считать тот ряд, где значения выше, а вторым рядом - тот, где значения ниже.
Гипотезы
H0 : Уровень признака в выборке 1 не превышает уровня признака в выборке 2.
H1: Уровень признака в выборке 1 превышает уровень признака в выборке 2.
Графическое представление критерия Q
На Рис. 2. представлены три варианта соотношения рядов значений в двух выборках, В варианте (а) все значения первого ряда выше всех значений второго ряда. Различия, безусловно, достоверны, при соблюдении условия, что п1,п2 >=11.
В варианте (б), напротив, оба ряда находятся на одном и том же уровне: различия недостоверны. В варианте (в) ряды частично перекрещиваются, но все же первый ряд оказывается гораздо выше второго. Достаточно ли велики зоны S1и S2, в сумме составляющие Q, можно определить по Таблице I Приложения 1, где приведены критические значения Q для разных п. Чем величина Q больше, тем более достоверные различия мы сможем констатировать.
Рис. 2 Возможные соотношения рядов значений в двух выборках; S1 - зона значений 1-го ряда, которые выше максимального значения 2-го ряда; S2 - зона значении второго ряда, которые меньше минимального значения 1-го ряда; штриховкой отмечены перекрещивающиеся зоны двух рядов
Ограничения критерия Q
1. В каждой из сопоставляемых выборок должно быть не менее 11 наблюдений. При этом объемы выборок должны примерно совпадать. Е.В. Гублером указываются следующие правила:
а) если в обеих выборках меньше 50 наблюдений, то абсолютная величина разности между n1 и n2 не должна быть больше 10 наблюдений;
б) если в каждой из выборок больше 51 наблюдения, но меньше 100, то абсолютная величина разности между п1и n2не должна быть больше 20 наблюдений;
в) если в каждой из выборок больше 100 наблюдений, то допускается, чтобы одна из выборок была больше другой не более чем в 1,5-2 раза (Гублер Е.В., 1978, с. 75).
2. Диапазоны разброса значений в двух выборках должны не совпадать между собой, в противном случае применение критерия бессмысленно. Между тем, возможны случаи, когда диапазоны разброса значений совпадают, но, вследствие разносторонней асимметрии двух распределений, различия в средних величинах признаков существенны (Рис. 3, 4).
Рис. 3. Вариант соотношения распределении признака в двух выборках, при котором критерии Q беспомощен
Рис. 4. Вариант соотношения распределении признака в двух выборках, при котором критерии Q может быть могущественным
Критические значения критерия Q Розенбаума для уровней статистической значимости р <=0,05 и р <=0,01 (по Гублеру Е.В., Генкину А.А., 1973)
Различия между двумя выборками можно считать достоверными (р <=0,05), если Qэмп равен или выше критического значения Q0,05,и тем более достоверными (р <=0,01), если Qэмп равен или выше критического значения Q0,01.
Практическая часть
АЛГОРИТМ. Подсчет критерия Q Розенбаума
1. Проверить, выполняются ли ограничения: n1,n2 >=11, n1= n2.
2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше, а выборкой 2 - ту, где значения предположительно ниже.
3. Определить самое высокое (максимальное) значение в выборке 2.
4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как S1.
5. Определить самое низкое (минимальное) значение в выборке 1.
6. Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как S2.
7. Подсчитать эмпирическое значение Q по формуле: Q=S1+S2
8. По Табл. 1. определить критические значения Q для данных n1 и n2. Если Qэмп. равно Q0,05 или превышает его, H0 отвергается.
9. При n1,n2>26 сопоставить полученное эмпирическое значение с QKp=8 (р <=0,05) и QKp=10(р <=0,01). Если Qэмп. превышает или по крайней мере равняется Qkp=8, H0 отвергается.
Ход работы.
У группы студентов был определен уровень эмпатии с помощью модифицированного опросника А.Меграбяна и Н.Эпштейна. Было опрошено 20 девушек и 16 юношей в возрасте от 20 до 23 лет. [3]
Результаты приведены в таблице 2.
Таблица 2
Девушки | Юноши | ||||
№ пп | Ф.И.О. | Общий бал по свойству эмпатии | № пп | Ф.И.О. | Общий бал по свойству эмпатии |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | А.Е.В. А.С.К. В.Е.К. Г.А.Ф. Е.К.В. Е.А.А. З.Н.С. К.О.Р. К.О.Н. К.И.А. Л.Л.С. Н.О.М. Н.Ж.А. П.В.Л. С.О.П. С.Н.С. Т.И.И. У.А.К. Я.Е.Л. Я.В.В. | 81 78 75 69 67 91 80 74 89 65 70 77 89 78 86 83 82 78 72 82 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | Б.Б.А. В.Г.А. Д.А.А. Е.А.В. Ж.Е.Н. И.С.В. К.К.А. Л.Е.П. Л.А.С. М.С.С. М.А.Д. О.М.С. П.А.В. С.В.В. Т.Г.И. Т.И.В. | 80 70 64 66 77 68 61 62 77 59 55 74 73 72 64 70 |
Сформулируем гипотезы: