влияют ли занятия физкультурой на общее самочувствие занимающихся школьников? Исследование он построил так: школьников просили отмечать на линейной шкале свое самочувствие до занятий физкультурой и после них.
Статистической обработке подлежат попарные сравнения показания одного и того же испытуемого до и после воздействия:
до воздействия | после него | разность рядов «до» и «после» | |
х | х2 | ||
3,2 | 3,8 | +0,6 | 0,36 |
1,6 | 1,0 | -0,6 | 0,36 |
5,7 | 8,4 | +2,7 | 7,29 |
2,8 | 3,6 | +0,8 | 0,64 |
5,5 | 5,0 | -0,5 | 0,25 |
1,2 | 3,5 | +2,3 | 5,29 |
6,1 | 7,3 | +1,2 | 1,44 |
2,9 | 4,8 | +1,9 | 3,61 |
åx = 8,4; | åx2 = 19,24 | ||
(åx)2 = 70,56 |
Нуль-гипотеза формулируется так: сравнение рядов до и после воздействия не дает оснований утверждать, что по измеряемому признаку произошли существенные изменения.
Выборка, подвергнутая изучению, состояла из 8 человек. Начнем с параметрического метода. Будет применен критерий tСтьюдента, его формула для попарного сравнения такова:
Нужно вычислить все величины, входящие в эту формулу. Для получения S используется формула:
Извлекая корень из полученной величины, узнаем значение S. Остается произвести по формуле все вычисления.
Ниже приводятся ряды, полученные в эксперименте (числа заимствованы из кн.: Бейли Н. Статистические методы в биологии. М., 1964).
При вычислении t при попарном сравнении число степеней свободы равно п -1. По таблице уровней значимости для t находим, что для 7 степеней свободы t0,95 должно быть не менее 2,36. Поскольку получена большая величина, следует признать, что налицо статистически значимое влияние занятий физкультурой на самочувствие школьников.
Из непараметрических методов для попарного сравнения удобен для пользования критерий Уилкоксона, правда, на небольших выборках этот критерий оказывается недостаточно мощным; его лучше применять на выборках объемом от 12 и более элементов.
Небольшие по объему выборки, однако, удобны для наглядного последовательного изложения техники расчетов.
Для использования этого критерия (его называют также знаково-ранговым) следует проранжировать, сначала не обращая внимания на знаки, весь перечень разностей между рядами «до» и «после». Если разность у отдельных испытуемых и в отдельных случаях нулевая, то она из ранжирования исключается и не входит в сумму рангов. В этом примере таких разностей (равных нулю) не встречается.
Далее нужно суммировать раздельно ранги разностей с положительным знаком и ранги разностей с отрицательным знаком. Значение критерия Т равно меньшей по абсолютной величине сумме рангов.
В этом примере Т = 3,5.
Ряд разностей | +0,6 | -0,6 | +2,7 | +0,8 | -0,5 | +2,3 | +1,2 | +1,9 |
Ранги | 2,5 | (2.5) | 8 | 4 | (1) | 7 | 5 | 6 |
Скобками указаны ранги разностей с отрицательными значениями. Но прежде чем отыскивать уровень значимости Т, нужно обратить внимание на то, что в данном случае критерий Уилкоксона — это двусторонний критерий. Как это понимать? Различают односторонние и двусторонние критерии. Отвергая нуль-гипотезу, выдвигают альтернативную ей гипотезу. При этом возникает вопрос: в какую сторону направлено отличие альтернативной гипотезы от Ho— в положительную или отрицательную. Если исследование предполагает равно возможными и ту, и другую направленности, следует принять двусторонний критерий. Возможна вместе с тем такая постановка исследования, когда учитывается лишь одна направленность результатов. Так, сравнивая две выборки учащихся по освоении ими научных химических понятий, исследователь ставит ограниченную задачу — рассмотреть только возможность преобладания в этом освоении одной выборки над другой. В этом исследовании применим односторонний критерий.
При описании статистических методов всегда указывается, какого рода критерий подлежит применению — односторонний или двусторонний. В таблицах уровней значимости обычно значения для одностороннего и для двустороннего критериев даются либо в особых столбцах, либо в таблице указывается, какому значению одностороннего критерия соответствует значение двустороннего, и наоборот.
Возвращаясь к рассматриваемому примеру, следует признать, что для него при обработке с помощью критерия Уилкоксона применим двусторонний критерий: различия между показателями «до» и «после» в одних строках положительные, в других отрицательные, учитываются те и другие.
В таблице уровней значимости для критерия Т, имея в виду, что критерий двусторонний, находим, что для 0,95 уровня значение Т должно быть не более 3. Поскольку получено значение Т = 3,5, hoне следует отклонять.
Следовательно, критерий t Стьюдента свидетельствует о том, что Ho подлежит отклонению, а T-критерий Уилкоксона свидетельствует о том, что нуль-гипотезу отвергать не следует. Такого рода расхождения, особенно при работе с небольшими выборками, вполне возможны. То, что критерий Уилкоксона Т всего на 0,5 превысил установленный уровень значимости, говорит о том, что при увеличении объема выборки в 1,5 или в 2 раза критерий Т также окажется значимым. В параграфе, где пойдет речь о планировании эксперимента, еще предстоит рассмотреть вопрос об объеме выборок.
Сравнение нескольких выборок по Уилкоксону. Иногда исследователю приходится сравнивать не две, а несколько выборок:
три, четыре и более. В таких случаях следует обратиться к простому и достаточно мощному непараметрическому критерию, представляющему собой модификацию критерия Уилкоксона. Метод позволяет сравнивать выборку с любой другой — вторую с третьей, первую с четвертой и т.д. Нужно, чтобы выборки были равными по численности.
Допустим, что учащимся 8-х классов четырех различных школ был предложен тест умственного развития. В школах использовались различные методы обучения и воспитания. Умственное развитие, как можно полагать, формировалось в каждой выборке в особых условиях. Эти условия и могли определить различия между выборками. Взято по 10 учеников из каждой школы. Их результаты и даны в таблице (табл. 3).
Таблица 3
№ | Школа I | Школа II | Школа III | Школа IV | ||||
Результат | Ранг (R1) | Результат | Ранг (R2) | Результат | Ранг (R3) | Результат | Ранг (R4) | |
1 | 96 | 36,5 | 96 | 36,5 | 32 | 9,5 | 40 | 15 |
2 | 82 | 30 | 100 | 39 | 27 | 3,5 | 38 | 14 |
3 | 80 | 28,5 | 93 | 34 | 68 | 23 | 42 | 18,5 |
4 | 78 | 25,5 | 87 | 33 | 78 | 25,5 | 32 | 9,5 |
5 | 34 | 11 | 100 | 39 | 54 | 21 | 31 | 8 |
6 | 42 | 18,5 | 28 | 5,5 | 56 | 22 | 28 | 5,5 |
7 | 42 | 18,5 | 80 | 28,5 | 83 | 31,5 | 42 | 18,5 |
8 | 69 | 24 | 94 | 35 | 22 | 1 | 30 | 7 |
9 | 79 | 27 | 25 | 2 | 41 | 16 | 36 | 13 |
10 | 100 | 39 | 83 | 31,5 | 27 | 3,5 | 35 | 12 |
åR | 258 | 284,5 | 156,5 | 121 |
Объединим результаты четырех школ в один ряд и проранжируем его. Для этого расположим ряд в порядке его возрастания и перенесем полученные ранги в таблицу (табл. 4).
Таблица 4
Результат | Ранг | Результат | Ранг | Результат | Ранг | Результат | Ранг |
22 | 1 | 34 | 11 | 54 | 21 | 83 | 31,5 |
25 | 2 | 35 | 12 | 56 | 22 | 83 | 31,5 |
27 | 3,5 | 36 | 13 | 68 | 23 | 87 | 33 |
27 | 3,5 | 38 | 14 | 69 | 24 | 93 | 34 |
28 | 5,5 | 40 | 15 | 78 | 25,5 | 94 | 35 |
28 | 5,5 | 41 | 16 | 78 | 25,5 | 96 | 36,5 |
30 | 7 | 42 | 18,5 | 79 | 27 | 96 | 36,5 |
31 | 8 | 42 | 18,5 | 80 | 28,5 | 100 | 39 |
32 | 9,5 | 42 | 18,5 | 80 | 28,5 | 100 | 39 |
32 | 9,5 | 42 | 18,5 | 82 | 30 | 100 | 39 |
Подсчитаем сумму рангов по каждой школе.
åR = 258 + 284,5 + 156,5 + 121 = 820.
Проверочная формула: åR = N/2(N+1) = 820, где N — общее число элементов, включающее все выборки. В этом примере оно равно 40.
Школа IåR = 258 | Школа II åR = 284,5 | Школа III åR = 156,5 | Школа IV åR= 121 |
Шк. I åR= 258 | 26,5 | 101,5 | 137 |
Шк. II åR = 284,5 | 26,5 | 156,5 | 163,5 |
Шк. III åR = 156,5 | 101,5 | 156,5 | 35,5 |
Шк. IV åR= 121 | 137 | 163,5 | 35,5 |
Далее суммы рангов по выборкам размещаются в матрице.
На пересечении строк и столбцов указываются разности, показывающие, насколько отличается сумма рангов каждой выборки от других выборок.
По таблице значимости устанавливается, что при n = 10 (учитывается объем отдельной выборки) и при четырех условиях достигают уровня значимости 0,95 — величина 134 и более, а уровня значимости 0,99 — величина 163 и более. Следовательно, существенное статистически значимое различие имеется между 1-й и 4-й выборками и между 2-й и 4-й выборками; в последнем случае на уровне значимости 0,99.