в) Методики с отрицательным подкреплением. Животное должно вести себя так, как установлено экспериментатором, чтобы избежать болевых стимулов. В наиболее распространенном варианте этой методики используется челночная камера. Она состоит из двух отделений, окрашенных в разные цвета. Отделения сообщаются между собой проемом. Процедура начинается с ряда проб, сопровождающихся сигналом, например, зуммером.Животному дается несколько секунд, чтобы покинуть стартовую камеру и перейти в другую часть установки. Если животное этого не сделает, оно получит удар электротоком через электроды на полу камеры. По мере повторения ряда проб процент успешных избеганий растет. Было показано. что даже среди близкородственных видов животных успешнее обучаются те животные, которые в природе ведут более активный образ жизни.
г) Выработка дифференцировки. В этих опытах животному предлагают два или несколько стимулов и предоставляют возможность как-нибудь реагировать. Реакции на один из стимулов подкрепляются, на другие - нет. Научение состоит в повышении процента реакций на “правильный” стимул. Например, обезьяна будет всегда получать банан, если будет из двух предъявляемых стимулов выбирать стимул красного цвета. Существует очень много вариантов выработки дифференцировки. Некоторые задачи способны решить только животные с достаточно развитым интеллектом.
Одновременная дифференцировка. Все стимулы предъявляются в одно и тоже время. Задача животного - выбрать правильный стимул.
Последовательная дифференцировка. Стимулы предъявляются по одному. Животное должно тормозить реакцию в присутствии неправильного стимула.
Переделка дифференцировки. Значение положительного стимула меняется от одной задачи к другой. Например, животное должно выбирать между красным и зеленым стимулом, причем красный - положительный. Через некоторое время, не информируя животное, начинают подкреплять зеленый стимул. Многие виды животных обнаруживают способность улучшать решение таких задач при их повторении, то есть вырабатывают установку на научение.
Отсроченные реакции дифференцировки. Приманку на глазах у животного помещают под один из двух предметов. Через длительный промежуток времени животное должно выбрать стимул, который подкрепляется.
Вероятностное научение. Во всех рассмотренных до сих пор случаях подкрепление в данной задаче было постояннным, или стопроцентным. Выбор одного из стимулов подкреплялся всегда, выбор другого - никогда. При вероятностном научени выбор “правильного стимула” подкрепляется чаще, чем выбор неправильного. Животное не может определить, ответ на какой из стимулов будет правильным. Например, можно подкреплять выбор красного стимула в 70% проб, а выбор зеленого стимула - в 30% проб. Задача на вероятность подкрепления в пропорции70:30. Хотя ясно, что при большом числе проб красный стимул будет подкреплен в 70%, невозможно предсказать, какой ответ окажется верным в данный момент. Максимальное число подкреплений животное получит, если будет выбирать тот стимул, который подкрепляется чаще. Эта стратегия выбора называется максимилизирующей.
У некоторых животных наблюдается выбор в соответствии с вероятностью подкреплений. В этом случае животное реагирует на каждый из стимулов с частотой, пропорциональной его подкреплению ( т.е. в нашем примере в 70% случаев на красный и в 30% случаев на зеленый). Животное, применяющее стратегию выбора в соответствии с вероятностью подкрепления, получит подкрепление в 58% проб (0,7х0,7 +0,3х0,3). При максимилизирующей стратегии животное получит подкрепление в 70% проб (0,7х1+0,3х0).
Интересно, что у одного и того же вида животных, например, у золотой рыбки, при зрительных (красный-зеленый) дифференцировках наблюдался выбор в соответствии с вероятностью подкрепления, а при пространственных дифференцировках (право-лево) наблюдалась максимилизирующая стратегия выбора.
д) Научение в лабиринте. Это одна из форм дифференцировок. Первый лабиринт для крыс построил Уильям Смолл в 1900 году. Простейший лабиринт напоминает по форме буквы
У или Т. Животное должно идти прямо до точки выбора. Сложные лабиринты имеют много точек выбора. Путь через лабиринт представляет чаще всего дорогу в гнездо крысы или , реже, дорогу к корму. Иногда нахождение “правильного” пути подкрепляется возможностью крысы убить мышь.
В опытах с лабиринтами фиксируются время решения задачи и число ошибок, то есть число тупиков, в которые заходила крыса. Была обнаружена интереснейщая закономернось - число ошибок начинает падать вначале обучения вблизи конца пути, у цели, и лишь затем - в начале лабиринта. Постепенно крысы научаются выбирать кратчайший путь к цели.
е) Научение решению задач на абстрактные понятия. Опыты проводятся на приматах. Под абстрактным понимается частичное свойство воспринимаемого, общее по крайней мере для двух объектов, различных по другим своим характеристикам. Абстрактное понятие люди обозначают словом, например: “больший” или “черный” или “квадрат”. У животных нет описательного языка, следовательно, у них нет понятий, тем не менее многие приматы способны решать задачи на дифференцировку стимулов, отличающихся абстрактным признаком. Например, из серии предъявляемых стимулов, чтобы получить подкреплениие, обезьяна должна выбирать стимул, больший по размеру, причем относительно больший.
Обезьян также научали выбирать стимул по признаку отличия. Животному предъявляли три стимул-объекта, два из которых одинаковы. Чтобы получить подкрепление, обезьяна должна была выбрать “третий лишний”. Ставились задачи на выбор по образцу. Наконец, давались задачи на чередавание. Животное должно по очереди выбирать то один, то другой объект (например, то правый, то левый). Более сложными задачами, с которыми приматы все же справлялись, были задачи на двойное и тройное чередование, а также задачи чередования отсроченных реакций.
18. Сходство и различие рефлексов 1-го и 2-го рода
При образовании рефлексов 1-го рода животное (или человек) начинает поведение с реакции, которая впоследствии связывается с новым стимулом. Иногда даже после одного сочетания безусловной реакции и нового стимула, животное начинает отвечать на новый (условный) стимул условной реакцией. “Ответ” по-английски “response”, отсюда возник термин “респондентеное научение”, употребляющийся, когда речь идет о “павловских” рефлексах.
В природе часто встречается ситуация, когда животное находится в состоянии голода, жажды или страха, но Безусловный стимул, который вызывал бы соответствующий Безусловный рефлекс, отсутствует. При этом у животного появляется поисковое поведение, в процессе которого оно спонтанно выполняет разнообразные действия: принюхивается (если речь идет о млекопитающих), осматривается, передвигается. Иногда одно из таких действий подкрепляется (например, пищей), тогда, если ассоциация повторяется несколько раз, животное учится выполнять целую последовательность действий, приводящую к положительному подкреплению в данной ситуации.
19. Опыты Скиннера
Американский психолог Скиннер на основании работ Торндайка предложил в 1938 году свободно-оперантную методику научения. “Камера Скиннера”, по-существу, представляет собой “проблемный ящик” Торндайка. Но в процессе выработки научения по-Скиннеру есть отличия от методики Торндайка.
Животное, обучаемое по методу Скинера, подвергается не отдельным пробам, как предлагал Торндайк, а имеет возможность свободно совершать любую двигательную реакцию в любое время.
Обычно в камере Скинера находится приспособление, на которое животное должно научиться воздействовать. Это может быть рычаг, на который нажимает млекопитающее для того, чтобы освободиться, или “ключ”, который должна научиться клевать птица, чтобы получить пищу или воду, или стеклянное кольцо, сквозь которое должна проплывать рыба и т.д.
В начале опыта животное выполняет движения, далекие от требуемых, но из всего числа выполняемых реакций экспериментатор подкрепляет те действия, которые приближаются к желаемой для экспериментатора реакции. При этом требования к реакции, заслуживающей подкрепления, постепенно повышаются.
Например, ставится цель научить голубя клевать светящуюся лампочку (ключ) для получения пищи или воды. Вначале экспериментатор подкрепляет всего лишь нахождение птицы в той части клетки, где расположена лампочка. После того, как птица сосредотачивает все свои движения в требуемом месте, экспериментатор начинает подкреплять только те движения, при которых птица удерживает голову на высоте ключа (лампочки). Стабилизировав подкреплением подобное поведение, экспериментатор теперь уже подкрепляет только реакцию клевания самого ключа. Голуби, находящиеся в камере Скиннера, расценивают ключ, который они клюют, как пищу или как воду. При пищевом подкреплении они клюют так же, как клевали бы зерно. Если подкреплением служит вода, то они нажимают на ключ полуоткрытым клювом и делают сосущие движения, как при питье.
Подкрепление не обязательно должно следовать за каждой реакцией. Иногда оно может быть перемежающимся: например, можно подкреплять только каждый н-ный ответ (режим фиксированной доли ответов), или только первую реакцию после данного интервала времени (режим фиксированных интервалов). Если подкрепление совсем прекратить, происходит снижение вероятности и темпа реакции (происходит угашение).
Природа реакций и подкрепления должны быть выбраны с учетом особенностей изучаемого вида. Например, самцов сиамских бойцовых рыбок удобно учить выполнять оперантную реакцию проплывания сквозь кольцо, используя в качестве подкрепления демонстрацию модели другой рыбы в агрессивной позе.
20. Различия между классическим условным рефлексом и оперантным
Во-первых, различны методики их выработки.