Литмир - Электронная Библиотека
Содержание  
A
A

Но вернемся к теории. В чем разница между павловскими реакциями (например, слюной, выделяющейся в ответ на включение лампочки) и выученными оперантными (пробежкой собаки по буму или танцем косатки)? Думаю, стоит повторить еще раз.

Собака Павлова, напомню, была зафиксирована в специальном станке. При павловском научении, если рассматривать его с точки зрения бихевиориста, поведенческие реакции остаются за скобкой. Подкрепление в экспериментах Павлова предъявляется независимо от поведения животного. Собака как стояла в станке, так и стоит. После подачи условного стимула (включения лампочки) она получает еду всегда. И наличие условной связи фиксируется по выделению слюны (условному рефлексу).

У бихевиористов животное — в нашем случае глухая косатка Морган — свободно как ветер (ну, почти, почти). И вообще, в их экспериментах изначально это была не косатка, не собака, а голубь, сидевший, гулявший и, вероятно, гадивший в специально оборудованном боксе. Чтобы получить подкрепление, он должен был совершить нечто задуманное экспериментатором. В первом случае Скиннер железной рукой направлял голубю в глаз струю воздуха. Чтобы избежать струи, голубь должен был отойти, что он и делал. Во втором случае ему нужно было клюнуть специальную педаль, чтобы получить зернышко. В третьем избегание воздушной струи вознаграждалось не только самим фактом избегания, но и подкреплялось зернышком. Это крайне ускоряло процесс обучения. Именно так был придуман контрастный метод дрессировки.

Таким образом, реакция, какое-то действие в ответ на стимул — это не просто «капающая слюна», это именно поведенческая реакция, деятельность, которая вознаграждается, если поведение нужное и правильное, либо не вознаграждается, если оно нежелательно. Поведение скиннеровского голубя по определению является деятельностью, и его последовательность такова: условный сигнал — нужная экспериментатору деятельность — пища. Таким образом, с точки зрения адепта системной дрессировки именно деятельность, помогающая голубю избежать неприятностей и (или) получить пищу, становится результативной.

Деятельность, к слову, — это не всегда действие, перемещающее тело в пространстве. Долго оставаться на месте без механического сдерживания — тоже деятельность. Помните леопарда Хана из Калининградского зоопарка? Когда он оставался неподвижным на таргете во время эпиляции хвоста с последующим покалыванием иголкой, он тоже работал.

Напомню, что, согласно воззрениям Скиннера, подкреплением является любое событие, которое, сочетаясь с определенным поведением, будет делать его более частым. Безусловно, этот механизм имеет гормональную основу, в которой решающую роль играет дофаминовая система подкрепления, о чем я уже писал. Именно приток «гормона радости» во время результативного поведения (подкрепления) делает возможным контробусловливание, когда влияние стимулов меняется со знака минус на знак плюс. Например, убирает у собаки страх перед машинами, громкими звуками.

Ох, не хочется, но придется тут прибегнуть к строгим формулировкам. Итак: под оперантным обучением мы понимаем целенаправленный отбор дрессировщиком тех или иных желательных действий животного и закрепление их с помощью положительных или отрицательных подкрепляющих воздействий. Навык подводится под стимульный контроль, то есть под команду. Стимульный контроль означает, что определенная команда запускает навык.

Вспомним нашего Горку, подававшего любой упавший предмет. Подкрепив подачу несколько раз, мы сделали это поведение более частым, постоянно практикуемым. Разучивали конкретный норматив апортировки, подведя подачу предмета под команду «держи». А в результате спонтанных действий собаки (подъема любых предметов с пола) и постоянного подкрепления этих действий (одобрением, лакомством) сделали такое поведение не просто частым, а я бы даже сказал, традиционным для Горки.

Впрочем, в использовании скиннеровского метода обучения есть вариант, когда стимул, который впоследствии превратится в команду, может подаваться прежде, чем она будет выполнена. Например, если вы наводите рукой с лакомством собаку на выполнение требуемого поведения (будущего навыка) или просто ставите питомца в нужное положение.

Наиболее правильно разучивать навык с помощью метода последовательного приближения. Неважно, используете вы наведение, таргет или «вылавливаете» с помощью условного подкрепления необходимый вам элемент поведения. Суть метода в том, что к конечной цели вы приближаетесь постепенно, от простого к сложному, разделив даже простейшее упражнение на составные, «нарезав» навык «на кусочки» подобно тому, как режете колбасу. Бывает, что навыки состоят из нескольких элементов, например навык движения по команде «вперед» в Бельгийском ринге, когда собака сломя голову бежит вперед, пока не упирается двумя лапами в заборчик.

Вроде бы чего проще, но на самом деле это два навыка: движение вперед и касание лапами препятствия (забора). Такие навыки нужно начинать разучивать с последнего элемента. Сначала вы учите собаку ставить обе лапы на небольшое возвышение (пенек), потом на ствол дерева (как вариант), потом еще на какой-нибудь предмет. Когда собака по вашей команде ставит лапы на все, на что вы укажете, вы начинаете учить ее делать это с разбега. Подводите навык под команду «вперед», постепенно увеличивая дистанцию, и в конце концов требуете увеличения скорости его выполнения.

Если вы работаете, используя бридж-сигнал (то есть условное подкрепление), очень важно научиться давать его вовремя — в тот самый момент, когда животное сделало то, что вам нужно. Например, вы хотите научить собаку сидеть с выдержкой. Для этого сначала бридж-сигналом подкрепляется сам факт посадки собаки (касание попой пола) и закрепляется связь с командой «сидеть». Причем на первых этапах не обязательно требовать от собаки мгновенного и четкого выполнения команды, села — и ладно. После этого вы начинаете подкреплять быструю и правильную посадку. Затем подкрепляете посадку, к примеру, перед вами — и игнорируете любые иные варианты. Только перед вами! Далее подкрепляете не просто посадку по команде перед вами, но и продолжительное нахождение в этой позе. Затем вы начинаете отходить от собаки и подкрепляете ее, если она продолжает сидеть. Постепенно можно усложнять упражнение и не просто отходить от собаки, а ходить вокруг нее. Можно даже подзывать ее с выдержки: если вы правильно подкрепляете поведение в позе «сидеть, замри», то чистота выполнения навыка укладки или посадки от этого не ухудшится. При правильной работе с бридж-сигналом собака не сорвется до подачи команды «ко мне», не поползет вперед, навстречу лакомству. Точно таким же способом можно формировать любые навыки в цирковой дрессировке и фристайле. Главное — вовремя, «снайперски», использовать условное подкрепление, чтобы оно не было, извините за каламбур, условно-досрочным или, наоборот, условно-отсроченным.

Кстати, зачем я рассказал историю про Морган? Для того чтобы показать, что в качестве условного подкрепления можно использовать любой сигнал: звонок, вспышку света, свист, щелчок кликера или «особое» слово тренера, например «Да!». Написал и понял, что нужно уточнить. На мой взгляд, у голосового бридж-сигнала есть некоторые ограничения.

— Иван Игоревич, — сказала мне Лида, кипер отдела хищных Калининградского зоопарка, — мы два вида таргета с Каюсом используем.

Каюс — здоровенный серый тюлень со скверным характером. Голова у него характерной для серых тюленей горбоносой бультерьерской формы, только больше раза в два, а нрав, в отличие от любвеобильных «булек», вполне себе склочный. Надо заметить, что серые тюлени не только охотятся на морских свиней, что само по себе требует силы духа и азарта, но и самцы еще, порой довольно серьезно, бьются друг с другом. Поэтому с агрессией у них все в порядке. Зоологи говорят в шутку, что серые тюлени — несостоявшиеся тюлени-леопарды Северного полушария. А на характер Каюса к тому же наложило отпечаток не очень благополучное пребывание в зоопарке, в котором он жил до переезда в Калининград. В общем, непростой попался экземпляр, но и с ним тоже нужно было проводить ветеринарный тренинг. По ходу замечу, что тренинг животного разными людьми в зоопарке — он как гегелевская свобода: осознанная необходимость, поскольку и киперы, и врачи имеют потребность в отпуске, иногда болеют — в общем, могут меняться.

33
{"b":"875697","o":1}