Как мы установили в главе 1, цель любого экспериментального исследования — сделать так, чтобы выводы, основанные на ограниченном количестве данных, оставались достоверными за пределами эксперимента. Это называется обобщением. Выполненный нами анализ безупречного эксперимента показывает, что достоверность экспериментальных выводов определяется по крайней мере двумя требованиями От них же зависит и правомерность возможных обобщений. Первое требование заключается в том, чтобы найденное в эксперименте отношение между независимой и зависимой переменными было свободным от влияния других переменных. Второе требование — чтобы постоянный уровень дополнительной переменной, задействованной в эксперименте, соответствовал ее уровню в более широкой области практики.
Мы уже знаем, что безупречный эксперимент невозможен, но он дает нам руководящие принципы для правильного планирования реальных экспериментов. Теперь мы можем задать вопрос о применении этих принципов. Ответ прост — нужно определить, насколько успешно реально проведенный эксперимент репрезентирует (представляет} эксперимент безупречный. Прежде всего посмотрим, в какой мере исключена в наших экспериментах возможность посторонних влияний на зависимую переменную.
В оригинальном исследовании, проведенном в ткацком цехе, испытуемая 13 недель работала с наушниками и 13 чередующихся с ними недель — без наушников. При «неудачном» пересмотре эксперимента она носила наушники в первые 13 недель, а следующие 13 работала без них. В идеальном эксперименте испытуемая должна была бы работать и с наушниками, и без них одновременно. Понятно, что схема чередования недель приближается к этому идеалу в, большей степени. Чередование двух условий, или АБАБАБАБАБ и т. д., более репрезентативно для их одновременного предъявления, чем последовательность, состоящая только из А и Б.
В своем первоначальном эксперименте Джек Моцарт разучивал пьесы в следующем порядке: целостный метод — частичный — частичный — целостный. В «неудачном» эксперимент последовательность была иной: 56целостный — целостный — частичный — частичный. В первом случае усредненные позиции целостного и частичного методов были одинаковы. Целостный метод занимал в последовательности позиции 1 и 4 среднее — 2,5. Позициями частичного метода были 2 и 3, среднее — 2,5. Напротив, в «неудачном» эксперименте целостный метод занимал позиции 1 и 2. среднее — 1,5, а частичный — 3 и 4, среднее — 3,5. Более репрезентативным для одновременного предъявления двух условий вновь оказался оригинальный эксперимент.
В первоначальном варианте своего эксперимента Йоко выпивала оба сорта сока — «Риттенхауз» и «БаддинБидл» — в случайном порядке в течение З6 дней. В "неудачно" измененном варианте она окончилась 4 днями. Ясно, что к бесконечности ближе 36, а не 4. Первоначальный план лучше репрезентирует бесконечный эксперимент, чем план измененный.
Эксперимент полного соответствия лучше представлен в оригинальном исследовании Джека, чем в его измененном варианте с вальсами. Хотя Джек и не разучивал все пьесы, которые он намеревался выучить в дальнейшем, он взял пьесы точно того же типа, т. е. выбрал соответствующий уровень дополнительной переменной. А вариант с вальсами оказывается «неадекватным», поскольку по своему уровню эти пьесы отличаются от тех, которые Джек разучивал бы в эксперименте полного соответствия.
Подводя итоги, можно сказать, что более надежную информацию об отношении между независимой и зависимой переменными дают те эксперименты, которые лучше представляют идеальный и бесконечный эксперименты. А чем ближе уровень значимой дополнительной переменной в проведенном эксперименте к ее уровню в эксперименте полного соответствия, тем лучше представлена в нем изучаемая реальная ситуация.
В зависимости от того, насколько реальные эксперименты представляют безупречный, их называют более или менее валидными. Безупречный эксперимент позволил бы безошибочно отделить верную гипотезу от неверной. Если бы Джек Моцарт смог провести безупречный эксперимент, он бы совершенно точно знал, какая из его гипотез верна: частичный метод лучше или целостный метод лучше. Таким образом, говоря о валидности эксперимента, вы оцениваете качество той работы, которую предполагаете провести для определения справедливости одной из конкурирующих гипотез.
Всем трем описанным нами «неудачным» экспериментам недоставало внутренней валидности. Это значит, что они не позволяют рассматривать полученную картину отношений между независимой и зависимой переменными как достоверную. И виноваты в этом, как мы убедились, всевозможные посторонние влияния. Эксперимент, которому недостает внутренней валидности, не может быть использован для выяснения того, какая гипотеза о связи независимойи зависимой переменных истинна, а какая ложна. Например, если нам не ясно, почему ткачиха работала лучше: потому, что она носила наушники, или потому, что стояла хорошая погода, — мы не вправе считать результаты эксперимента достаточными для определения истинной и ложной гипотез о влиянии наушников на производительность труда.
Термин "внутренний" подчеркивает существо данного вида валидности. Можно сказать, что эксперимент, лишенный внутренней валидности, неудачен, так сказать, изнутри, по самой своей сути. Действительно, если он не позволяет убедиться в достоверности найденного отношения независимой и зависимой переменных, он просто бесполезен.
«Неадекватный» эксперимент, который мог бы провести Джек, разучивая вальсы вместо сонат, не был бы неудачным в принципе. Это был бы вполне нормальный эксперимент по заучиванию вальсов. Бесполезным его считать нельзя. Джек мог бы использовать свои результаты, если бы задним числом решил, что на самом деле он искал наиболее эффективный метод заучивания вальсов. Однако этому эксперименту недостает внешней валидности. Он не обеспечивает достаточных оснований для определения верной и неверной гипотез о лучшем методе заучивания сонат.
Термин «внешний» относится к определению тематики проводимого эксперимента — чему именно он посвящен. В данном случае эксперимент не был внешне валидным потому, что "сонаты" — такая же необходимая составная часть проверяемой гипотезы, как независимая и зависимая переменные.
Понятия внешней и внутренней валидности являются центральными для всей нашей книги. Их применение в последующих главах в основных чертах определяется тем, что мы только что сказали. Сейчас мы приведем и более формальные определения этих понятий. Правда, все их значение вы поймете только тогда, когда познакомитесь с экспериментальными проблемами более высокого порядка. Но у вас уже будет основа для общего понимания и дальнейшего уточнения того, что такое валидность и два ее вида.
Начнем со схематического изображения экспериментальной гипотезы:
Независимая переменная ... Отношение ... Зависимая переменная ... Уровни других переменных. Итак, гипотеза включает в себя само отношение и обозначения обеих его сторон. Определение валидности эксперимента, как внутренней, так и внешней, состоит в следующем. Это степень правомерности вывода об экспериментальной гипотезе, которую обеспечивают результаты данного эксперимента по сравнению с результатами эксперимента, безупречного во всех трех аспектах.
Понятие внутренней валидности эксперимента касается только самого отношения и не затрагивает того, что именно соотносится. Отсюда внутренняя валидность — это степень правомерности вывода об экспериментальной гипотезе, основанного на результатах данного эксперимента, по сравнению с тем выводом, в основе которого лежат результаты идеального и бесконечного экспериментов, где изменения независимой и зависимой переменных происходят в одних и тех же условиях, а все другие, побочные факторы остаются неизменными.
Любой эксперимент сталкивается также с проблемой соответствия исследуемой ситуации — реальной. Вопрос о соответствии уровня дополнительной переменкой, типа музыки, уже возникал. Несколько позже мы обсудим подобные вопросы для независимых и зависимых переменных. Понятно, что вопросы о соответствии касаются содержания того, что стоит по обе стороны изучаемого отношения. Это и есть вопросы внешней валидности. Ее можно определить как степень правомерности данного вывода об экспериментальной гипотезе по сравнению с тем выводом, который основан на результатах эксперимента с полным соответствием независимой, зависимой и уровнями всех дополнительных переменных.
В настоящей главе мы обсудим главным образом проблему внутренней валидности. В любом эксперименте вы с самого начала столкнетесь с этой проблемой; если внутренняя валидность не достигнута, рассматривать внешнюю не имеет смысла. Вспомните, что в главе 1 были представлены эксперименты такого типа, для которых вопросы внешней валидности практически не обсуждаются. А в следующей главе мы рассмотрим эксперименты, в которых именно эти вопросы выступают на первый план.
Мы можем сказать, что эксперимент валиден, не зная фактически, правильны ли выводы. Мы можем оказать, что он невалиден, не зная, что выводы ошибочны. Причина в том, что мы не можем знать наперед, какая из двух конкурирующих гипотез верна. Ведь если бы мы об этом знали, нам не надо было выпроводить эксперимент. Если бы Джек заранее знал, какая из двух его гипотез справедлива: (1) частичный метод лучше или (2) целостный метод лучше, — он мог бы не проводить свое исследование.