Введение в психологию Аткинсон Смит Бем (стр. 166 из 278)

<Рис. Поскольку генотипы идентичных близнецов одинаковы, процессы взаимодействия их личностей с окружением будут способствовать их сходству и поддерживать его в дальнейшем, даже если они растут в разных окружениях.>

Общее и раздельное окружение. Исследования близнецов позволяют оценить не только то, насколько индивидуальные различия обусловлены генетическими вариациями, но и то, насколько эти различия обусловлены или общими для членов семьи аспектами окружения (например, социоэкономическим положением семьи), или теми его аспектами, которые у членов семьи различны (например, круг друзей вне семьи). Удивительно, но различия, обусловленные общими аспектами окружения, не объясняют почти ни одного различия, связанного с окружением в целом: за вычетом генетического сходства, двое детей из одной семьи одинаковы не более, чем двое детей, взятых случайно из выборочной группы (Plomin & Daniels, 1987). Это означает, что те переменные, которые, как правило, изучаются психологами (особенности воспитания, социоэкономическое положение семьи, образование родителей), фактически не вносят вклада в индивидуальные различия. Как это может быть?

Одно из возможных объяснений состоит в том, что реактивные, вызванные и проактивные процессы направлены на уменьшение различий, обусловленных разным окружением, пока это окружение допускает некоторую гибкость реагирования. Одаренный ребенок, живущий в семье, где им совсем не занимаются, или в совсем бедной семье, скорее, чем его менее одаренный брат или сестра, усвоит много сведений из телепрограмм (реактивное взаимодействие), привлечет внимание сочувствующего ему учителя (вызванное взаимодействие) и самостоятельно отправится в библиотеку (проактивное взаимодействие). Генотип такого ребенка действует в противовес отупляющим влияниям его домашней среды, и поэтому он развивается иначе, чем менее одаренные брат или сестра. Этим направляемым личностью процессам могут воспрепятствовать только суровые ограничения со стороны окружения (Scarr, 1988; Scarr & McCartney, 1983). В пользу этого говорят данные, что самыми несхожими были те пары воспитывавшихся порознь идентичных близнецов, в которых кто-то один воспитывался в среде с жесткими ограничениями.

Хотя это объяснение и выглядит правдоподобным, прямых подтверждений ему нет. Во всяком случае, представляется, что исследователям придется перейти от обычного сравнения детей из разных семей к сравнению детей из одной семьи и особое внимание уделить взаимодействию личности и окружения внутри таких семей.

Аналогично, большее внимание должно уделяться влияниям, источники которых находятся за пределами семьи; один автор высказывает предположение, что группа сверстников представляет собой намного более значимый источник личностных различий между детьми, чем семья (Harris, 1995).

Оценка индивидуальных различий

Во многих промышленно-развитых странах широко используется объективная оценка индивидуальных различий, особенно различий в когнитивных и интеллектуальных способностях. В начальных школах детей часто распределяют по классам в зависимости от достигнутого ими успеха при прохождении тестов. Тесты на одаренность или способности являются частью процедуры поступления во многие колледжи и большинство профессиональных и высших учебных заведений. Кроме того, многие промышленные и правительственные агентства подбирают кадры, назначают и продвигают сотрудников по службе на основе данных тестирования.

Тесты для оценки интересов, склонностей и личных качеств также знакомы большинству из нас. Помогая учащимся выбрать профессию, консультанты смогут предложить лучший выбор, если им что-то известно об учащемся помимо его академической успеваемости. Отбирая кандидатов на высокие посты, наниматели часто хотят знать их стиль общения, способность справляться со стрессом и т. д. Какое лечение будет наиболее успешным для человека с эмоциональными нарушениями, или как помочь реабилитации освобожденного уголовника — для всего этого нужна объективная оценка индивидуальных различий. Помимо практических применений, эти методы оценки существенны для теории и исследований индивидуальных различий. Действительно, некоторые ученые, изучающие личность (см. гл. 13), разработали методы оценки, отвечающие особенностям их подходов.

Характеристики хорошего теста?

Поскольку тесты и другие средства анализа играют важную практическую и научную роль, необходимо, чтобы они точно измеряли то, для чего предназначены, а именно они должны обладать надежностью и валидностью.

Тесты также должны быть стандартизированы; под этим понимается, что условия прохождения теста должны быть одинаковыми для всех тестируемых. Например, инструкции, сопровождающие тест, должны быть одинаковыми для всех тестируемых лиц.

Надежность. Если тест или метод оценки надежен, он должен давать воспроизводимые и согласованные результаты. Если тест дает разные результаты при применении его в разных случаях или при выполнении подсчетов разными людьми, значит, он ненадежен. Простая аналогия — резиновая линейка. Если неизвестно, насколько она растягивается при каждом измерении, то результаты будут ненадежны, независимо от того, насколько аккуратно проводилось каждое измерение.

Как правило, надежность оценивается путем соотнесения двух групп показателей. Например, один и тот же тест можно дать той же группе испытуемых дважды. Если тест надежный, то показатели испытуемых в первом случае должны высоко коррелировать с показателями во втором. Если это так, то говорят, что этот тест обладает повторяемой надежностью или временной стабильностью.

Конечно, в реальной практике мало кто захочет давать один и тот же тест тем же людям дважды. Но есть много ситуаций, когда возникает желание провести аналогичные виды того же теста — например, когда учащиеся выпускного класса средней школы, намерившиеся поступить в колледж, хотят дважды пройти Тест школьной успеваемости (Тест Академических Способностей) (Scholastic Assessment Test, SAT). Чтобы убедиться, что две формы того же теста дают эквивалентные показатели, обе они предлагаются той же группе людей и затем сопоставляются. Если получена высокая корреляция между ними, то говорят, что этот тест обладает надежностью при изменении формы. Некоторые из вопросов, входящих в SAT, на самом деле не связаны с показателями учащегося, но они оцениваются статистически, чтобы их можно было использовать в будущем в аналогичных формах этого же теста.

Другой общей мерой надежности является внутренняя согласованность теста — то, в какой степени разные его вопросы или пункты измеряют одно и то же. Это можно оценить путем вычисления корреляции между показателями, полученными группой индивидов по каждому пункту и всему тесту в целом. Всякий пункт, не коррелирующий с общим показателем, является ненадежным; он не вносит вклад в измеряемый тестом параметр. Отбрасывание ненадежных пунктов «очищает» тест, повышая его внутреннюю согласованность. С увеличением числа надежных элементов в тесте растет и надежность общего показателя теста.

Результаты большинства тестов и анализов обрабатываются объективно, чаще всего компьютером. Но иногда требуется оценить умственную деятельность или социальное поведение субъективно. Знакомый пример этому — экзаменационные испытания. Чтобы оценить надежность таких субъективных суждений, с помощью независимых судей получают две или более групп данных, которые сопоставляются друг с другом. Например, два наблюдателя могут независимо оценивать группу детсадовских детей на агрессию; или двух или более судей могут попросить прочитать прошлые инаугурационные обращения президента и оценить их с точки зрения оптимистичности или количества негативных ссылок на Ирак. Если корреляция между оценками судей высока, то говорят, что данный метод обладает межэкспертным согласием или межоценочной надежностью.

Вообще, хорошо построенный, объективно обработанный тест способности должен обеспечивать надежность не менее 0,90. Для тестов личности и субъективных суждений, применяемых в исследовательских целях, приемлемым иногда может быть коэффициент 0,70, но при этом заключения о конкретном человеке следует делать с большой осторожностью. Как отмечалось выше, надежность общего показателя теста возрастает с ростом числа надежных пунктов теста. Это же рассуждение можно применить к субъективным оценкам и повысить надежность метода, добавив больше судей, оценщиков или наблюдателей. Например, если корреляция оценок двух наблюдателей составляет только 0,50, то исследователь может добавить третьего аналогичного наблюдателя и тем самым повысить межоценочную надежность их суммарных оценок до 0,75; с добавлением четвертого оценщика надежность возрастет до 0,80.

Валидность. Надежность показывает, насколько тест способен измерять что-то, но высокая надежность не гарантирует, что этот тест измеряет именно то, что требуется; она не гарантирует валидности (адекватности) теста. Например, если в последнем экзамене вашего курса психологии встречается слишком много трудных слов или заковыристых вопросов, то он может оказаться тестом ваших вербальных способностей или вашей изощренности, а не усвоения материала курса. Такой экзамен может быть надежным: при повторном прохождении учащиеся получат те же оценки и отдельные компоненты экзамена будут измерять одно и то же, — но это не будет валидным тестом достижений в данном курсе.

Иногда валидность теста можно оценить, сопоставив показатель теста с некоторым внешним критерием. Такая корреляция называется коэффициентом валидности. Например, относительно сильная положительная корреляция между показателями в SAT и успехами первокурсника в колледже показывает, что у этого теста приемлемая валидность. Валидность такого рода называется критериальной, или эмпирической, валидностью. Учитывая чувствительность тестов к расовым и половым различиям, суды все чаще требуют от компаний и правительственных агентств, применяющих тесты для отбора персонала, чтобы эти тесты коррелировали с показателями работы человека, то есть чтобы они обладали критериальной, или эмпирической, валидностью.