В табл. 1 в обобщенной форме представлен набор, состоящий из пяти чрезвычайно сложных планов эксперимента. Наблюдения или измерения обозначены в таблице буквой О, а буква X относится к экспериментальному воздействию независимой переменной, которое получают испытуемые из данной группы. В каждом из этих экспериментов участвуют, по крайней мере, две группы испытуемых. Некоторые испытуемые получают данное воздействие; другие не подвергаются такому воздействию. Распределение испытуемых по группам, подвергающимся и не подвергающимся экспериментальному воздействию, всегда производится случайным образом (с помощью рандомизации). На случайный характер распределения испытуемых по группам указывает буква R. Например, самый простой из представленных в таблице планов — это план для двух рандомизированных групп. Экспериментальное воздействие получают только испытуемые из первой группы, после чего проводятся наблюдения за обеими группами.
Группа 1 | R | X | 0 |
Группа 2 | R | 0 |
В таблице также приводится перечень различных причин нарушения внешней валидности, которые были описаны выше. Если в столбце, соответствующем конкретной причине нарушения валидности, стоит «да», то это означает, что данный план эксперимента не позволяет устранить ошибки такого типа. «Нет» означает, что при данном плане эксперимента такая проблема не возникает. (Причины нарушения внутренней валидности в таблице не указаны. Ни одна из них не является источником проблем, если правильно спланирована и проведена экспериментальная процедура.)
«Лучшим» планом, позволяющим свести к минимуму количество источников нарушения валидности, является план для отдельной выборки с предварительным и итоговым тестированием. В этом случае экспериментатор случайным образом распределяет испытуемых по нескольким группам. Сначала экспериментатор тестирует реакции до экспериментального воздействия, но только у половины испытуемых. Оставшаяся половина испытуемых проходит тестирование через какое-то время. Однако те испытуемые, тестирование которых проводится позднее, также делятся пополам, так что одна группа получает экспериментальное воздействие, а другая не
415
Таблица 1
Некоторые планы эксперимента, минимизирующие источники нарушения валидности
Внешние причины нарушения валидности | ||||
Эффект тестирования | Взаимодействие факторов отбора и экспериментальной переменной | Воздействие условий эксперимента | Интерференция экспериментальных воздействий | |
Планы эксперимента | 1 | 2 | 3 | 4 |
I. План с предварительным и итоговым тестированием | Да | Возможно | Возможно | Нет |
Группа | ||||
1 RO О | ||||
2 ROXO | ||||
2. План Соломона для четырех групп | Нет | Возможно | Возможно | Нет |
Группа | ||||
1 ROXO | ||||
2 RO О | ||||
3 R ХО | ||||
4 R О | ||||
3. План с тестированием только после воздействия | Нет | Возможно | Возможно | Нет |
Группа | ||||
1 R ХО | ||||
2 R О | ||||
4. План с серией последовательных тестирований | ||||
и контролем | Да | Нет | Возможно | Нет |
Группа: Время —> | ||||
1 RООООООО | ||||
2 ROOOXOOO | ||||
5. План с предварительным и итоговым | ||||
тестированием для отдельной выборки | Нет | Нет | Нет | Нет |
Группа |
* Здесь рандомизируется как распределение испытуемых по группам, так и выбор групп, получающих экспериментальное воздействие.
416
получает. Кроме того, читателю следует обратить внимание на одну важную отличительную особенность этого плана. Можно показать, что концептуальный статус независимой переменной не ограничивается единственным набором конкретных операций. При использовании двух различных наборов операций (Х1и Х2), которые оба являются производными одной и той же концептуальной независимой переменной, появляется возможность делать из конкретных наблюдений общие выводы, относящиеся к абстрактным переменным.
Это описание показывает, что при любом плане эксперимента рандомизация играет очень важную роль. Важно также, чтобы наблюдения за испытуемыми не влияли на поведенческие результаты экспериментальных воздействий.
417
В ходе лабораторных и полевых исследований производится оценка реакций людей. В этой книге мы проанализировали много исследований и вкратце описали, как в них проводилось измерение зависимой переменной. В данном приложении мы дадим более подробное описание некоторых основных методов психологических измерений. Эти методы часто служат основой для разработки специфических оценок, удовлетворяющих потребностям конкретного исследования. Мы сосредоточим основное внимание на оценке установок, которые являются центральным понятием этой книги. Мы также коротко расскажем о том, как можно оценивать другие компоненты систем установок.
Если вы задумаетесь над этим вопросом, то поймете, что оценка установки — далеко не простая задача. Как измерить нечто, находящееся в человеческом сознании? Можно догадаться, что единственный способ решения этой проблемы — заставить человека сделать внутренние установки внешними, чтобы их можно было оценить. Иными словами, надо добиться, чтобы внутренние установки человека выразились в его внешнем поведении. Элементом этого поведения может быть прохождение письменного тестирования или заполнение анкеты.
Шкалы установок
Для оценки установок разработано несколько различных письменных тестов. Четыре теста после тщательной разработки достигли довольно высокого уровня совершенства. В число этих основных методов тестирования установок входят метод равных интервалов Терстоуна, метод суммируемых оценок Ликерта, шкалограмм-ный анализ Гуттмана и метод семантического дифференциала Осгуда. Надеемся, что, ознакомившись с краткими обзорами каждого из этих методов, вы получите ясное представление о том, как социальные психологи получают данные, на основе которых они потом делают столь красивые обобщения.
418
В основе каждого из обсуждаемых методов лежат различные предположения о характере пунктов теста и характере информации об установках человека, которую можно получить в результате тестирования. Тем не менее есть некоторые основные предположения, которые являются общими для всех этих методов. В первую очередь предполагается, что субъективные установки поддаются количественному измерению, т. е. мнение каждого человека можно охарактеризовать с помощью какого-либо числового показателя. Во-вторых, во всех этих методах предполагается, что каждый конкретный пункт теста имеет одинаковый смысл для всех респондентов, и поэтому данный ответ будет оцениваться одинаково, кто бы его ни дал. Эти предположения могут быть не всегда оправданными, но до сих пор еще не разработана такая методика измерений, чтобы можно было обойтись без этих предположений.
Метод равных интервалов Терстоуна. Первый из основных методов оценки установок был разработан в 1929 году Терстоуном в работе, посвященной исследованию установок по отношению к религии. Создав шкалу оценки установок, он впервые предложил методику точных измерений для области исследований, в которой они прежде никогда не использовались. Терстоун предположил, что можно отобрать высказывания, содержащие мнения по какому-нибудь конкретному вопросу, и ранжировать эти высказывания по показателю, отражающему благоприятное или неблагоприятное отношение к данному вопросу, выраженное в высказываниях. Кроме того, можно ранжировать эти высказывания таким образом, чтобы разность показателей соседних высказываний континуума оказалась одинаковой. Последнее предположение позволяет дать количественную оценку расхождений между установками разных людей. Терстоун также предположил, что между высказываниями нет корреляционной связи и что в каждом высказывании выражена точка зрения, которая не зависит от других высказываний. Это означает, что из принятия одного высказывания не следует, что надо обязательно принять еще и какое-либо другое.
Шкала Терстоуна состоит примерно из 20 независимых высказываний, содержащих мнения по определенному вопросу. Каждому высказыванию соответствует значение показателя на числовой шкале, которое определяется его положением в континууме, а это положение в свою очередь определяется в соответствии с усредненными судейскими оценками.
Чтобы оценить установки людей по данному вопросу, их просят отметить те высказывания, с которыми они согласны. Общая оценка установок каждого человека определяется как среднее значение показателей тех высказываний, которые он отметил. Ниже приводится в качестве примера сокращенный вариант такой шкалы (табл. 2).