Поэтому, особенно при проверке надёжности тестов мощности (например, интеллектуальных тестов) и достижений, предпочтение следует отдавать третьему методу, поскольку он предполагает лишь однократное тестирование. Третий метод оценки надёжности включает два различных приёма расчёта: разделение тестовых задач на две части, например по принципу "чётные и нечётные", и расчёт коэффициента консистентности задач теста.
Валидность (или обоснованность) всякой процедуры измерения состоит в однозначности (устойчивости) получаемых результатов относительно измеряемых свойств объектов, то есть относительно предмета измерения. Отличие понятия "валидности" от "надёжности" измерения удобно раскрывать с помощью различения "объекта" и "предмета" измерения.
Надёжность - это устойчивость процедуры относительно объектов. Надёжность не обязательно предполагает валидность. В психологии довольно часто возникает такая ситуация, когда исследователь вначале предлагает определённую процедуру измерения, показывает её надёжность – способность устойчиво различать объекты, но вопрос о валидности остаётся открытым.
Устойчивость теста относительно объектов (испытуемых) является необходимым, но не достаточным условием его устойчивости относительно измеряемых атрибутов (свойств) объектов. Надёжность является необходимым, но не достаточным условием валидности. Отсюда понятно основное соотношение психометрики:
валидность < надёжность.
Это означает, что валидность теста не может превышать надёжности теста.
Данное соотношение, однако, неверно трактовать как указание на прямо пропорциональную связь валидности и надёжности. Повышение надёжности отнюдь не обязательно приводит к повышению валидности. В терминах Анны Анастази [11] валидность определяется репрезентативностью теста относительно измеряемой области поведения.
При проверке устойчивости распределения общая логика основывается на индуктивном рассуждении: если "половинное" (полученное по половине выборки) распределение хорошо моделирует конфигурацию целого распределения, то можно предположить, что это целое распределение будет также хорошо моделировать распределение генеральной совокупности.
Таким образом, доказательство устойчивости распределения означает доказательство репрезентативности тестовых норм.
Репрезентативность критериальных тестов. В тестах по критерию в качестве реального эталона применяется критерий, ради которого создаётся тест – целевой критерий. Особое значение такой подход имеет в тех областях практики, где высокие результаты могут дать узкоспециализированные диагностические методики, нацеленные на очень конкретные и узкие критерии. Такая ситуация имеет место в обучении: тестирование, направленное на получение информации об уровне усвоения определённых знаний, умений и навыков (при профессиональном обучении), должно точно отражать уровень освоения этих навыков и тем самым давать надёжный прогноз эффективности конкретной профессиональной деятельности, требующей применения этих навыков.
Процентильная шкала. Когда в качестве единственного эталона измерения психодиагностами рассматривается сам тест, то в качестве меры измеряемого свойства выступает местоположение балла на кривой распределения. Применяется Процентильная шкала. В качестве универсальной меры, пригодной для разных (по своей качественной направленности и количеству пунктов) тестов, используется "Процентильная мера". Процентиль – процент испытуемых из выборки стандартизации, которые получили равный или более низкий балл, чем балл данного испытуемого.
Таким образом, в качестве источника данной меры выступает нормативная выборка (выборка стандартизации), на которой построено нормативное распределение тестовых баллов. Процентильные шкалы лежат в основе всех традиционных шкал, применяемых в тестологии (Точки MMPI, стены 16 PF и др.)
Стандартизация шкалы. В психометрике следует различать две формы стандартизации. Под стандартизацией теста понимают, прежде всего, стандартизацию самой процедуры проведения, инструкций, бланков, способа регистрации, условий и т. п. Без стандартизации теста невозможно получить нормативного распределения тестовых баллов и, следовательно, тестовых норм.
Под стандартизацией шкалы понимают линейное преобразование масштаба нормальной (или искусственно нормализованной) шкалы.
Применение стандартных шкал позволяет прибегать на практике к более грубым, приближённым способам проверки типа распределения тестовых баллов.
Применение стандартных шкал необходимо для соотнесения результатов по разным тестам, для построения "диагностических профилей" по батарее тестов и тому подобных целей.
Каждому из нас приходится оценивать других. Естественно, нелегко делать это объективно, особенно, когда под рукой нет необходимых психодиагностических методик. Предлагаемый тест (№ 28) поможет выяснить, есть ли у вас способности в области психологии, умение реально оценивать людей или вы нередко "грешите" по отношению к ним.
Не слишком задумываясь, выберите один из вариантов ответа на каждый из предложенных вопросов.
1. По вашему, те, кто всегда придерживается правил хорошего тона:
а) вежливы, приятны в общении;
б) строго воспитаны;
в) просто скрывают свой истинный характер.
2. Вы знаете супружескую пару, которая никогда не ссорится. По-вашему:
а) они счастливы;
б) равнодушны друг к другу;
в) у них нет доверия друг к другу.
3. Вы впервые видите человека, и он сразу начинает рассказывать вам анекдоты. Вы решите, что он:
а) остряк;
б) он чувствует себя неуверенно и таким образом пытается выйти из этого неприятного состояния;
в) хочет произвести на вас приятное впечатление.
4. Вы говорите с кем-то на интересную тему, ваш собеседник сопровождает разговор жестикуляцией. Вы считаете, что он:
а) волнуется;
б) неискренен.
5. Вы решили получше узнать кого-либо из своих знакомых. Считаете, что необходимо:
а) пригласить его в какую-либо компанию;
б) понаблюдать его в деле.
6. Кто-то в ресторане дает большие "чаевые". Вы убеждены:
а) он хочет произвести впечатление;
б) ему нужно расположение официанта;
в) это от щедрости души.
7. Если человек никогда не начинает разговор первым, вы считаете:
а) он скрытничает;
б) он слишком робок;
в) он боится быть непонятым.
8. По вашему мнению, низкий лоб человека означает:
а) глуповатость;
б) упрямство;
в) нельзя сказать о человеке что-либо конкретное.
9. Что вы думаете о человеке, который никогда не смотрит другим в глаза:
а) у него комплекс неполноценности;
б) он неискренен;
в) он слишком рассеян.
10. Человек с высоким достатком всегда покупает дешевые вещи. Вы думаете:
а) он бережлив;
б) он скромен;
в) он скряга.