Для того чтобы лучше разобраться в приведенных примерах, нам нужно теперь вернуться к некоторым аспектам подкрепления.
Различные стороны процесса подкрепления
Подкрепление - это такое воздействие, при котором появление или исчезновение какого-то стимула в результате той или иной поведенческой реакции повышает вероятность повторения этой реакции. Например, если голодное животное каждый раз будет находить в определенном углу помещения пищу, то оно будет все чаще направляться в этот угол (хорошим примером могут служить эксперименты Олдса, в которых были открыты центры удовольствия; см. документ 6.4). И напротив, если после зажигания красной лампочки животное будет
312
получать удар током, а избежать его можно будет только перепрыгнув из одной половины клетки в другую, то вероятность такой реакции на красную лампочку будет возрастать. В первом случае потребление пищи или удовольствие, получаемое при электростимуляции мозга, играет роль положительного подкрепления. Во втором случае речь идет об отрицательном подкреплении1 - предотвращении электрического удара.
Часто смешивают отрицательное подкрепление с наказанием. Однако, как мы уже знаем, подкрепление всегда увеличивает вероятность повторения данной поведенческой реакции, а наказание, наоборот, приводит к исчезновению такой реакции, которая сочтена нежелательной. Значит, в отличие от подкрепления при наказании стремятся либо подать аверсивный раздражитель (например, нанести животному удар током или отшлепать ребенка), либо лишить вознаграждения (вкусной еды или ласки) каждый раз, когда проявляется такая форма поведения, которую нужно устранить.
Скиннер и многие психологи принципиально отрицают наказание как средство воспитания, предпочитая в основном использование положительных подкрепляющих факторов, которые способствуют выработке у ребенка социально адекватного поведения, а не подавлению социально неадекватного. По их мнению, нежелательные формы поведения легко могли бы исчезнуть, если бы те, кому доверен процесс воспитания, осуществляли его правильно и не были вынуждены наказывать за то, что они сами вначале непроизвольно поощряли.
Кроме того, бихевиористы различают первичное и вторичное подкрепление. Первичное подкрепление - это удовлетворение физиологических потребностей, таких как голод, жажда, сон и т. п. Что касается вторичного подкрепления, то здесь речь идет об удовлетворении, как-то связанном с другими подкрепляющими факторами (первичными или вторичными). Когда мы получаем гонорар или диплом за выполненную работу, когда ребенка награждают игрушкой или военного - орденом2, когда человек получает престижную должность -во всех этих случаях действует вторичное подкрепление, удовлетворение социальных потреб-
1Надо сказать, что этот термин несколько неудачен, так как всякое подкрепление по определению должно способствовать выработке какой-то формы поведения, т. е. оказывать положительное действие. Видимо, правильнее было бы в обоих случаях говорить о подкреплении, но не о положительном и отрицательном, а о положительном и аверсивном (в зависимости от его значения для организма). Однако условности и общепринятые правила, особенно в науке, довольно живучи, и поэтому многие студенты еще долго будут недоумевать по поводу того, почему организм может столь активно стремиться к отрицательному подкреплению.
2Такое подкрепление широко практиковалось Наполеоном -основателем ордена Почетного легиона и ярко выраженным лидером. Его приемы поощрения вошли в историю: всем известно, что он мог потрепать за ухо гвардейца, который, возможно, вскоре будет убит в сражении, или присвоить дворянский титул первому подвернувшемуся вояке в награду за какие-то услуги.
Научение 313
ностей, повышающее самоуважение у лиц, у которых оно высоко развито или, наоборот, поколеблено.
Угасание, дифференцировка и генерализация
Мы уже видели, что как при реактивном, так и при оперантном научении приобретенная реакция сохраняется лишь до тех пор, пока ее поддерживают безусловным раздражителем (в первом случае) или специальным подкреплением (во втором случае). Если же эти подкрепляющие факторы перестают действовать, то выработанное на их основе поведение быстро угасает и после нескольких попыток прекращается вовсе. Например, если сразу после звонка не следует подача пищи, у собаки вскоре перестает в ответ на этот стимул выделяться слюна. Точно так же, если в семье новорожденного ребенка вдруг перестанут интересоваться звуками, которые он произносит, его словарный запас, скорее всего, не будет развиваться быстро и адекватным образом. Все это проявления процесса угасания.
Важно отметить, что речь здесь идет именно об угасании, а не об исчезновении или «стирании следов». Дело в том, что если снова начать предъявлять безусловный раздражитель или подкрепляющий фактор, то исчезнувшее было поведение почти сразу же восстанавливается.
С угасанием тесно связана так называемая дифференцировка. При дифференцировке те поведенческие реакции, которые перестают сопровождаться безусловным раздражителем или подкреплением, исчезают, и сохраняются лишь такие реакции, при которых эти факторы продолжают действовать. Например, если внезапно прекратить подачу пищи после звука колокольчика, но продолжать давать ее в сочетании со звуком зуммера, то слюноотделение на первый из этих звуковых раздражителей прекратится, а на второй сохранится. Точно так же и наш младенец в приведенном выше примере постепенно перестанет издавать неподкрепляемые звуки, и будет повторять лишь те, за которыми следует социальное поощрение.
Важнейшую роль в научении путем выработки условных связей играет процесс генерализации1. Именно благодаря этому явлению вновь образованная связь распространяется на все то, что похоже на безусловный раздражитель или на ситуацию, в которой происходило подкрепление. Например, в опытах Уотсона и Рейнер у маленького Альберта (см. документ 7.1) быстро выработался страх перед всеми белыми пушистыми предметами - от бороды деда Мороза до мехового воротника на пальто матери. Все мы знаем, как быстро наступает генерализация у плаксивых детей - сначала они хнычут, требуя конфету, а потом-уже всегда, как только им чего-нибудь захочется, будь то игрушка в магазине или телевизионная передача, идущая по параллельному каналу одновременно с любимой передачей родителей (табл. 7.1).
Схемы | Реактивное обусловливание | Оперантное обусловливание |
Синонимы | Павловское, классическое | Скиннеровское, инструментальное |
Способ научения | Путем ассоциации между специфическим стимулом (вызывающим естественный рефлекс) и нейтральным стимулом (2а) | Путем ассоциации между поведением и его последствиями (2б) |
Соответствующие типы поведения | Рефлекторные и эмоциональные реакции | Произвольное поведение |
Степень участия организма в целом | Связь между безусловным (БС) и условным (УС) стимулами формируется при пассивном участии организма в целом (2а) | Для формирования связи между реакцией и подкреплением необходимы активные действия организма над объектами окружающей среды (2б) |
Временные отношения | Индифферентный стимул (ИС) в большинстве случаев должен предшествовать безусловному (БС) (3а) | Реакция всегда должна предшествовать подкреплению (3б) |
Временные отношения | Физиологическая связь между УС и безусловным рефлексом (БР) (1а) | Связь между реакцией и естественным поведенческим репертуаром организма (16) |
Типы связей | Никакой физиологической связи между индифферентным стимулом (ИС) и условным рефлексом (УР) (2а) | Никакой физиологической связи между реакцией и подкреплением (26) |
Угасание | В результате отмены БС (4а) | В результате отмены подкрепления (46) |
Генерализация | УР вызывается всеми стимулами, сходными с УС | Реакция возникает во всех ситуациях, сходных с той, в которой происходило подкрепление |
Дифференцировка | УР остается только на те сходные с УС стимулы, после которых следует БС | Остаются только те реакции, за которыми следует подкрепление |
Павлов называл этот процесс «иррадиацией».- Прим. перев.
(1а) [БС]——Физиологич(2а) [БС]—[ИС]Ассоциации (индиффер стимулами(За)[ее] + | —•[БР еская с—-[БРч между ентным ) | ] вязь между БС]/ ИСи БС и безусловны!»^ш | и БРVI |
1 ИС = УС | |||
ИС в резуг может пре способны(4а)а | пьтате а вратит и вызы | ссоциации с БС ься в УС, вать УР | |
^ | Угасание УР | ||
EiОтмена Б | С вызь | вает угасание ) | /Р |
{•\б) | -^ | еакцио А>\ | \ | |||
Ситуация | Х | 'S, | ||||
-.ip | еакция В| | |||||
Реакции н (26) | а с | ит | уацик | о Х случай | ны | |
Подкр. | —— F | 'еакция А | ||||
У | ||||||
Ситуацир | =«Х | ^ | ||||
^1 | Еакция В | |||||
Подкрепг в ситуаци(36) | пен и | ие Х | связ | ано с реак | цией | А |
Реакция / | !\- | |||||
Подкр. | условная | |||||
у | ||||||
Ситуаци | я> | <!' | ^ | Реакция | В | |
Подкреп обуслов Другиеf(46) | ляПИЕзеа | юн зан кц | пая с ие ре ии уг | итуация вь 'акции. асают | 13ЫЕ | эает |
Угасани | е | |||||
^ | f реакци | иА | ||||
Ситуац | ля | Х | ^ | |||
Отмена угасани | по еу | ДКел | репле овно | ения вызы и реакции | вает |
316Глава 7
Бихевиористы предложили множество различных сфер применения методов обусловливания в различных областях человеческой деятельности. Чаще всего реактивное и оперантное научение используется в психотерапии, когда врач пытается применить соответствующие принципы для помощи определенным больным. Подобные примеры приведены в документах 3.1 и 3.2. Подробнее мы рассмотрим этот вопрос в главе 12.