Смекни!
smekni.com

Обучение с подкреплением (стр. 4 из 7)

Способы и приемы или закономерности

Есть два аспекта выработки: первый способ и приемы, то есть последовательность шагов, необходимых для выработки типа поведения, и второй — закономерности или правила, предписывающие, как, когда и почему эти типы поведения должны подкрепляться

Большинство тренеров, большинство книг о тренировке и большинство тех, кто обучает тренеров, имеет дело почти исключительно со способом или приемом. “Возьмите в руки клюшку для гольфа как показано на рисунке”, “Подведите прицел винтовки под нужное место мишени”, “Никогда не наклоняйтесь в горах”, “Взбивайте яйца металлическим венчиком по часовой стрелке” Это прекрасно. Эти приемы обычно складываются годами при участии многих людей, путем проб и ошибок, и поэтому они оптимальны. В самом деле вы будете более уверенно сидеть на лошади, если пятки у вас опущены, а мяч для гольфа будет послан вами дальше, если вы хорошенько отклонитесь в сторону замаха. Если вы заинтересованы в том, чтобы овладеть каким-либо навыком, я могу вас уверить, что вы извлечете максимум возможного от устоявшихся приемов выполнения действий, которые включаются в данный навык, почерпнув это из книг, от преподавателей, инструкторов и наблюдая или изучая действия других людей

Другую сторону выработки составляют закономерности, которые регулируют сам процесс обучения: когда надо поднажать, когда подослабить обучение; как наиболее эффективно повышать критерии, что делать, если возникли затруднения, и, вероятно, самое главное — когда остановиться. В этих вопросах обычно полагаются на интуицию и опыт тренеров или инструкторов, на случай иди удачу. Между тем именно успешность применения этих закономерностей определяет разницу между просто хорошим и великим преподавателями, между радостным, быстрым и успешным обучением и обучением, приводящим к срывам, медленным, скучным и неприятным. Хороший процесс выработки, а не только хорошие приемы, делают обучение эффективным.

Десять правил выработки

1. Повышайте критерий небольшими градациями, чтобы у субъекта, всегда была реальная возможность выполнить требуемое и получить подкрепление.

2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно.

3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т.е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент.

4. Вводя новый критерий, временно ослабьте старые.

5. Будьте впереди того, кого вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого, вы знали, что следует подкреплять далее.

6. Не меняйте тренеров на “середине реки”; у вас может быть несколько инструкторов на одного обучающегося, но придерживайтесь одной программы выработки на каждый из типов поведения.

7. Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать.

8. Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию.

9. Если навык ухудшается, “возвратитесь к детскому саду”, быстро повторите весь процесс выработки с серией легких подкреплений.

10. Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого.

Особые ученики

Можно формировать поведение почти любого существа. Психологи обучали крошечных детей движением руки гасить и зажигать свет в комнате. Можно обучать птиц. Можно формировать поведение рыб. Однажды я обучала большого краба-отшельника звонить в колокольчик, собирающий к обеду, дергая клешней за шнурок. (Фокус заключался в том, чтобы дать крабу пищу в тот момент, когда клешня, двигающаяся бесцельно, коснется шнурка. Я пользовалась длинным анатомическим пинцетом, чтобы подносить кусочки креветки прямо к его челюстям.) Профессор Гарвардского университета Рихард Хернетейн рассказывал, что однажды он обучал морского гребешка хлопать раковиной за пищевое вознаграждение. Дрессировщики морских млекопитающих любят хвастаться что они могут обучить любое животное выполнить любое действие, для которого у него имеются физические и умственные возможности, и насколько мне известно, это так и есть.

А как насчет того, чтобы формировать свое поведение? Существуют всевозможные программы изменения собственного поведения: бросаем курить, следим за своим весом и т.д. Большинство этих программ опирается в основном на метод формирования поведения, обычно называемый модификациями поведения, они могут быть или не быть успешными. Трудность, как мне кажется, состоит в том, что вы должны сами себе давать подкрепление. Но когда вы подкрепляете сами себя, исчезает элемент неожиданности — ученик всегда знает, чего стоит тренер. При этом очень просто сказать: “Черт с ней, с еще одной звездочкой в моей карточке, я лучше выкурю сигарету”.

Я обнаружила, что единственным наиболее успешным приемом самоподкрепления является постоянная регистрация результатов, которая может быть использована во всех четырех программах. Нужно было вести регистрацию так, чтобы улучшение было видно сразу. Я использовала графики. С их помощью моя виновность за упущения могла уменьшаться при взгляде на график, на котором было видно, что несмотря ни на что я сейчас нахожусь на более высоком уровне, чем шесть месяцев тому назад. Еще, может быть, далеко до совершенства, но “кривая”, или наклонная линия, графика шла в нужном направлении, и это является зримым доказательством улучшения; и хотя это само по себе является слабым, медленно действующим подкреплением, оно создает достаточную мотивацию, чтобы продолжать мои занятия.

Выработка поведения без помощи слов

В обычных ситуациях обучения, таких, как уроки тенниса, субъект знает, что ее или его обучают, и обычно охотно включается в этот процесс. Поэтому вам не обязательно дожидаться нужной реакции и подкреплять ее. Вы можете без особого вреда словами направлять поведение: “Делай так. Хорошо. Теперь повтори дважды. Хорошо”. Однако в нестандартных ситуациях лучше обойтись без инструкций и (словесных) обсуждений. Вы должны наметить план выработки, начальный и промежуточные ходы, при помощи которых вы достигнете желаемой цели.

В использовании процесса формирования существуют две ловушки. Первая состоит в том, что легче заметить ошибки, чем улучшение, и поэтому для таких вербальных существ, каковыми являемся мы, гораздо проще негодовать, когда критерий не достигнут, чем давать подкрепление, когда он достигнут. И это может свести на нет прогресс. Вторая опасность состоит в том, что если вы предполагаете сформировать чье-либо поведение, то очень заманчиво поболтать об этом. А такие разговоры могут все разрушить. Если вы говорите: “Ты получишь награду” — за то, что положил белье в корзину, не куришь марихуану, тратишь меньше денег или за что-либо другое, — вы лишь совершаете подкуп или даете обещание, а не истинное подкрепление; при обучении, идущем по вашему плану, человек может иногда ему противиться и нарочно поступать не так как нужно. Чтобы добиться результатов, надо осуществлять формирование поведения, а не говорить о нем.

А если вам удалось сформировать чье-либо поведение, то в дальнейшем также лучше этим не хвастаться. Некоторые этого совершенно не понимают и постоянно подчеркивают свою роль — в лучшем случае это проявляется в опеке, а это лучший способ нажить себе в лице субъекта врага на всю жизнь. Кроме того, если вы помогли кому-то улучшить какой-либо навык или избавиться от плохой привычки, меняя в качестве подкрепления собственное поведение, на кого падает основная тяжесть работы? На субъекта. Умные родители никогда не раззванивают повсюду о том благе, которое они совершили, воспитывая своих детей. Во-первых, мы все знаем, что эта работа никогда не кончается, а во-вторых, дети заслуживают похвалы — хотя бы за то, что выдерживают все педагогические ошибки, которые мы совершаем.

Так как формирование поведения людей может или даже должно происходить в несловесной форме, то некоторые воспринимают это как своего рода злонамеренные манипуляции. Мне кажется, что это не от недопонимания. Причина того, что формирование должно быть невербальным, состоит в том, что мы имеем дело с поведением, а не с идеями, И не только с чьим-нибудь поведением, но и со своим собственным.

Однако поскольку вы можете формировать поведение людей без того, чтобы то, что вы делаете, доходило до их сознания, и поскольку, не имея формального согласия на то, чтобы быть обученным, как это бывает при уроках игры в теннис, вы едва ли не обязаны формировать людское поведение на невербальном уровне, то не возникает ли возможность заставлять людей совершать ужасные вещи?

Конечно, да, особенно если вы в качестве отрицательного подкрепления используете такие резко неприятные стимулы, которые вызывают истинный страх и даже ужас. В лабораторных условиях психологи обнаружили феномен названный “выученная беспомощность”. Если животное обучено избегать неприятного стимула, такого как удар электрического тока, при помощи нажима на рычаг или перемещения в другую часть клетки, где нет абсолютно никаких способов избежать удара тока, оно постепенно прекращает все попытки отделаться от неприятности. Оно становится полностью податливым и пассивным, и может даже лежать и получать наказания даже тогда, когда снова появляется путь к свободе. Аналогом этого феномена у людей возможно является “промывание мозгов” Если человек подвергается строгой изоляции и неизбывному страху или боли, и если неприятные стимулы в последующем используются в качестве отрицательного подкрепления, то в тех случаях, когда человек может избегнуть или прекратить их действие, изменив поведение, — ну, тогда... животные обычно погибают, а люди оказываются более стойкими, и некоторые начинают делать все что угодно, чтоб избежать отрицательного подкрепления.