Смекни!
smekni.com

Курс лекций Математические методы в психологии (стр. 17 из 32)

Эти правила оговариваются в описании каждого из представлен­ных в руководстве критериев.

В некоторых случаях расчетная формула критерия включает в се­бя количество наблюдений в исследуемой выборке, обозначаемое как п. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице мы определяем, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого крите­рия является критерий φ*, вычисляемый на основе углового преобразо­вания Фишера.

В большинстве случаев, однако, одно и то же эмпирическое зна­чение критерия может оказаться значимым или незначимым в зависи­мости от количества наблюдений в исследуемой выборке (n) или от так называемого количества степеней свободы, которое обозначается как ν или как df.

Число степеней свободы V равно числу классов вариационного ряда минус число условий, при которых он был сформирован (Ивантер Э.В., Коросов А.В., 1992, с. 56). К числу таких условий относятся объем выборки (n), средние и дисперсии.

Если мы расклассифицировали наблюдения по классам какой-либо номинативной шкалы и подсчитали количество наблюдений в каж­дой ячейке классификации, то мы получаем так называемый частотный вариационный ряд. Единственное условие, которое соблюдается при его формировании - объем выборки п. Допустим, у нас 3 класса: "Умеет работать на компьютере - умеет выполнять лишь определенные опера­ции - не умеет работать на компьютере". Выборка состоит из 50 чело­век. Если в первый класс отнесены 20 испытуемых, во второй - тоже 20, то в третьем классе должны оказаться все остальные 10 испытуе­мых. Мы ограничены одним условием - объемом выборки. Поэтому даже если мы потеряли данные о том, сколько человек не умеют рабо­тать на компьютере, мы можем определить это, зная, что в первом и втором классах - по 20 испытуемых. Мы не свободны в определении количества испытуемых в третьем- разряде, "свобода" простирается только на первые две ячейки классификации:

V = c-l = 3- 1 = 2

Аналогичным образом, если бы у нас была классификация из 10 разрядов, то мы были бы свободны только в 9 из них, если бы у нас было 100 классов - то в 99 из них и т. д.

Способы более сложного подсчета числа степеней свободы при двухмерных классификациях приведены в разделах, посвященных кри­терию χ2 и дисперсионному анализу.

Зная п и/или число степеней свободы, мы по специальным таб­лицам можем определить критические значения критерия и сопоставить с ними полученное эмпирическое значение. Обычно это записывается так: "при n=22 критические значения критерия составляют ..." или "при v=2 критические значения критерия составляют ..." и т.п.

Критерии делятся на параметрические и непараметрические.

Параметрические критерии

Критерии, включающие в формулу расчета параметры распределения, то есть средние и дисперсии (/-критерий Стьюдента, критерий F и др.)

Непараметрические критерия

Критерии, не включающие в формулу расчета параметров распределе­ния и основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т Вилкоксона и др.)

И те, и другие критерии имеют свои преимущества и недостатки. На основании нескольких руководств можно составить таблицу, позво­ляющую оценить возможности и ограничения тех и других (Рунион Р., 1982; McCall R., 1970; J.Greene, M.D'Olivera, 1989).

Таблица 1.1

Возможности и ограничения параметрических и непараметрических критериев

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

1. Позволяют прямо оценить различия в средних, полученных в двух вы­борках (t - критерий Стьюдента).

2.Позволяют прямо оценить различия в дисперсиях (критерий Фишера).

3.Позволяют выявить тенденции изме­нения признака при переходе от ус­ловия к условию (дисперсионный
однофакторный анализ), но лишь при условии нормального распреде­ления признака.

4.Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ).

5.Экспериментальные данные должны отвечать двум, а иногда трем, усло­виям:

а) значения признака измерены по интервальной шкале;

б) распределение признака является нормальным;

в) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса.

6.Математические расчеты довольно сложны.

7.Если условия, перечисленные в п.5, выполняются, параметрические кри­терии оказываются несколько более
мощными, чем непараметрические.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

1. Позволяют оценить лишь средние тенден­ции, например, ответить на вопрос, чаще ли в выборке А встречаются более высо­кие, а в выборке Б - более низкие значе­ния признака (критерии Q, U, φ* и др.).

2.Позволяют оценить лишь различия в диа­пазонах вариативности признака (критерий φ*).

3.Позволяют выявить тенденции изменения признака при переходе от условия к усло­вию при любом распределении признака (критерии тенденций L и S).

4.Эта возможность отсутствует.

5.Экспериментальные данные могут не от­вечать ни одному из этих условий:

а) значения признака могут быть пред­ставлены в любой шкале, начиная от шка­лы наименований;

б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения
необязательно и не нуждается в проверке;

в) требование равенства дисперсий отсут­ствует.

6.Математические расчеты по большей час­ти просты и занимают мало времени (за исключением критериев χ2 и λ).
7.Если условия, перечисленные в п.5, не выполняются, непараметрические критерии оказываются более мощными, чем пара­метрические, так как они менее чувствительны к "засорениям".

Из Табл. 1.1 мы видим, что параметрические критерии могут оказаться несколько более мощными4, чем непараметрические, но толь­ко в том случае, если признак измерен по интервальной шкале и нор­мально распределен. С интервальной шкалой есть определенные про­блемы (см. раздел "Шкалы измерения"). Лишь с некоторой натяжкой мы можем считать данные, представленные не в стандартизованных оценках, как интервальные. Кроме того, проверка распределения "на нормальность" требует достаточно сложных расчетов, результат кото­рых заранее неизвестен (см. параграф 7.2). Может оказаться, что рас­пределение признака отличается от нормального, и нам так или иначе все равно придется обратиться к непараметрическим критериям.

4 О понятии мощности критерия см. ниже.

Непараметрические критерии лишены всех этих ограничений и не требуют таких длительных и сложных расчетов. По сравнению с пара­метрическими критериями они ограничены лишь в одном - с их помо­щью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака. Эту задачу может решить только дисперсионный двухфакторный анализ.

Учитывая это, в настоящее руководство включены в основном непараметрические статистические критерии. В сумме они охватывают большую часть возможных задач сопоставления данных.

Единственный параметрический метод, включенный в руково­дство - метод дисперсионного анализа, двухфакторный вариант которого ничем невозможно заменить.

Вопрос 6. Уровни статистической значимости

Уровень значимости - это вероятность того, что мы сочли разли­чия существенными, а они на самом деле случайны.

Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при р<0,05, то мы имеем виду, что вероятность того, что они все-таки недостоверны, составляет 0,05.

Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при р<0,01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01.

Если перевести все это на более формализованный язык, то уро­вень значимости - это вероятность отклонения нулевой гипотезы, в то время как она верна.

Ошибка, состоящая в той, что мы отклонили нулевую гипотезу, в то время как она верна, называется ошибкой

1 рода.

Вероятность такой ошибки обычно обозначается как α. В сущно­сти, мы должны были бы указывать в скобках не р<0,05 или р<0,01, а α<0,05 или α<0,01. В некоторых руководствах так и делается (Рунион Р., 1982; Захаров В.П., 1985 и др.).

Если вероятность ошибки - это α, то вероятность правильного решения: 1—α. Чем меньше α, тем больше вероятность правильного решения.

Исторически сложилось так, что в психологии принято считать низшим уровнем статистической значимости 5%-ый уровень (р≤0,05): достаточным – 1%-ый уровень (р≤0,01) и высшим 0,1%-ый уровень (р≤0,001), поэтому в таблицах критических значений обычно приводятся значения критериев, соответствующих уровням статистической зна­чимости р≤0,05 и р≤0,01, иногда - р≤0,001. Для некоторых критериев в таблицах указан точный уровень значимости их разных эмпирических значений. Например, для φ*=1,56 р=О,06.

До тех пор, однако, пока уровень статистической значимости не достигнет р=0,05, мы еще не имеем права отклонить нулевую гипотезу. В настоящем руководстве мы, вслед за Р. Рунионом (1982), будем придерживаться следующего правила отклонения гипотезы об отсутст­вии различий (Но) и принятия гипотезы о статистической достоверно­сти различий (Н1).

Правило отклонения Hо и принятия H1

Если эмпирическое значение критерия равняется критическому значе­нию, соответствующему р≤0,05 или превышает его, то H0 отклоняет­ся, но мы еще не можем определенно принять H1.

Если эмпирическое значение критерия равняется критическому значе­нию, соответствующему р≤0,01 или превышает его, то H0 отклоняется и принимается Н1.