Надежность взаимозаменяемых форм - повторное тестирование выборки испытуемых параллельной формой теста через минимальный интервал времени при одних и тех же условиях.
За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя параллельными формами теста. Высокий коэффициент корреляции и большой интервал между двумя испытаниями свидетельствуют о высокой надежности теста.
Возможный обман со стороны испытуемого, его искушенность, события, происшедшие в интервале между тестированиями, не оказывают особого влияния (как в ретестовом методе) на степень надежности теста. Если фактор тренировки снижен при тестировании параллельными формами, то эффект переноса принципа заданий часто имеет место. Эффект переноса следует учитывать при построении параллельных форм.
Требования к построению параллельных форм:
1. параллельные формы должны быть независимо построенными тестами, но отвечать одним и тем же требованиям;
2. должны содержать одинаковое количество заданий со сходной степенью трудности;
3. эквивалентность параллельных форм необходимо проверять ретестовым методом.
Метод расщепления состоит в том, что тест разбивают на две сопоставимые части. Респондент выполняет задания этих двух частей в течение одного сеанса с получением двух результатов (например, тест Равена содержит две части: четные и нечетные задания).
За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя этими частями. Он называется коэффициентом внутренней согласованности теста.
Валидность и надежность. Тест может быть надежен, но не валиден. Это означает, что он измеряет какое-то свойство очень точно, но какое именно - остается под вопросом. В такой ситуации необходима более точная валидизация теста, как содержательная, так и практическая.
Дискриминативность - это способность отдельных заданий теста и теста в целом дифференцировать обследуемых относительно ''максимального" и "минимального" результатов теста. Дискриминативность измеряется показателем дельта Фергюсона и принимает максимальное значение при равномерном (прямоугольном) распределении показателей (d=1).
Точность информации измеряется тем, насколько дробной шкалой являются применяемые метрики, или, другими словами, насколько чувствителен инструмент. Таким образом, это степень приближения результатов измерения к истинному значению измеряемой величины.
Конечно, каждый исследователь должен стремиться получить наиболее точные данные. Однако создание инструмента, обладающего нужной степенью точности, в ряде случаев достаточно трудное дело. Всегда необходимо решить, какая мера точности является допустимой. При определении этой меры исследователь пользуется всем арсеналом теоретических представлений об объекте.
При помощи тщательного конструирования теста можно обеспечить соответствующий уровень дискриминативности, а это именно то, в чем тесты значительно выигрывают по сравнению с другими формами испытаний. В общем, было обнаружено, что в оценке может быть использовано около девяти градаций, а в опросах, вероятно, наиболее эффективно использовать 3 (или пять) градации: ниже среднего, средний уровень и выше среднего. Подобно этому, шкалы ранжирования редко содержат более девяти градаций. Это означает, что испытуемые разбиваются в лучшем случае на девять групп.
психика психологическая диагностика психометрия
Особой разновидностью валидности является достоверность, которая требует специальных усилий и процедур по ее обеспечению. Речь идет о сознательных или бессознательных искажениях, которые вносит 6 тестовые результаты сам испытуемый, руководствуясь в ходе теста особой мотивацией, отличающейся от той, которая присуща ему в реальном поведении.
Способность теста защищать информацию от мотивационных искажений испытуемого и есть достоверность теста. Особенно остро эта проблема стоит в случае тестов-опросников, которые допускают больше свободы в выборе испытуемым любого варианта ответа.
Типичный прием обеспечения достоверности - наличие в тест-опросниках шкал лжи. Шкала лжи - это шкала, состоящая из вопросов, касающихся незначительных проступков, которые совершаются большинством людей. Эти шкалы основываются главным образом на феномене социальной желательности - стремлении испытуемых давать в ходе тестирования социально одобряемую информацию.
Если испытуемый набрал по шкале лжи балл выше критического, то его протокол объявляется недостоверным и ему предлагается либо выполнить данный тест еще раз, будучи более откровенным, либо выполнить другой тест. Многие более специфичные "ловушки", направленные на измерение достоверности, часто входят как компонент в структуру конкретного теста.
Достоверность тестирования тесно связана со степенью доверительности общения с психологом. Здесь принято различать две диагностические ситуации: консультативную (ситуация клиента) и аттестационную (ситуация экспертизы). В первом случае испытуемый участвует в тестировании на добровольной основе и сам заинтересован получить рекомендации по результатам тестирования (например, в профконсультации). Во втором случае тестирование проводится по инициативе педагога или администрации, психолога, родителей, т.е. других лиц, и эти другие больше заинтересованы в результатах, чем сам испытуемый.
Понятно, что в аттестационной ситуации вопрос о достоверности особенно актуален. И опросники, не снабженные шкалами лжи, использовать в таких ситуациях бесполезно. Наоборот, в ситуации клиента могут быть использованы методики, на которые испытуемый заведомо будет отвечать некорректно в ситуации экспертизы.
Целью данного реферата было рассмотреть общее понятие о дифференциальной психометрии и областях ее применения.
В соответствии с поставленным целям в реферате были исследованы: сущность дифференциальной психометрии, области ее применения, а также психометрические требования, такие как надежность и валидность качества исследований.
Были сделаны следующие выводы:
1. Дифференциальная психометрия – область психометрии, определяющая и обосновывающая требования к измерению индивидуально-психологических различий в психологической диагностике.
2. Дифференциальная психометрия, как особое направление психометрии, возникла в связи с появлением и развитием психологических тестов и окончательно оформилась в конце 20-х – начале 30-х гг. нашего века.
3. Основными направлениями дифференциальной психометрии являются: общая теория измерения психологических феноменов, конструирование на ее основе средств измерения, их психометрическая адаптация к новым условиям пользования, а в связи с этим анализ задач тестовых, обеспечение их валидности, надежности и дискриминативности.
Как видно из обсуждения проблемы, все вышеперечисленные требований к методикам взаимосвязаны. Нарушение одного требования сводит на нет и другое: скажем, данные могут быть обоснованны, но не устойчивы. В психологическом исследовании такая ситуация может возникнуть тогда, когда проводимое тестирование оказалось ситуативным, т. е. время его проведения могло играть определенную роль и в силу этого возник какой-то дополнительный фактор, не проявляющийся в других ситуациях.
1. Общая психодиагностика / Под ред. А.А.Бодалева, В.В.Столина.– М.: Изд-во МГУ, 1987.
2. Словарь-справочник по психологической диагностике / Бурлачук Л.Ф., Морозов С.М., отв. ред. С.Б. Крымский. – Киев : Наук. думка, 1989. С. 114-116.
3. Ярошевский М.Г. История психологии. – М.: Мысль, 1976. С.463
4. О. В. Белова. Психологическая диагностика как наука.