Литмир - Электронная Библиотека
Содержание  
A
A

В процессах, рассмотренных в четвертом — седьмом разделах этой главы, посредством обучения устанавливается новая связь между независимо функционирующими нервными процессами. Представление об обучении в общем смысле, которого придерживались старые психологи — исследователи поведения, такие, как Вильгельм Вундт и Ч. Л. Халл, весьма точно подходит к описанным процессам. Но если критически сопоставить различные американские теории обучения, как это сделал К. Фоппа в своем прекрасном сжатом обзоре, то снова и снова бросается в глаза, сколько вреда причиняет теоретическим построениям большинства авторов описанная на с. 278–279 тенденция к единообразному объяснению. Снова и снова пытаются справиться со всеми процессами обучения с помощью единственной, всеохватывающей теории. То, что при этом называется «обучением», — это не существующий в действительности промежуточный предмет между процессами, описанными в этой главе, и другими, в основе которых лежит совершенно иная и более сложная организация нервных процессов. Эти процессы составляют предмет следующей главы.

Глава 6

ОБРАТНОЕ СООБЩЕНИЕ ОБ УСПЕХЕ И ДРЕССИРОВКА ВОЗНАГРАЖДЕНИЕМ

(conditioning by reinforcement)

1. НОВАЯ ОБРАТНАЯ СВЯЗЬ

Все животные, у которых центральная нервная система достигла определенного уровня дифференциации, т. е. головоногие, ракообразные, паукообразные, насекомые и позвоночные, включая человека, обладают способностью к приобретению знаний, превосходящей своей эффективностью все до сих пор рассмотренные когнитивные механизмы, а именно способностью к обучению в более узком смысле слова. У психологов, далеких от биологии и ничего не знавших о конвергентном[79] приспособлении, наличие этой способности у столь многих различных организмов вызвало ошибочное представление, что здесь идет речь о первичном феномене, об основной форме любого приобретения знаний или даже о единственном элементе поведения вообще. В действительности же пять указанных групп животных развили свой нервный аппарат, лежащий в основе рассматриваемой функции, столь же независимо друг от друга, посредством конвергентного приспособления, как они выработали свои глаза и конечности, также независимо возникшие в каждой из этих групп.

Обучение посредством проб и ошибок возникло как типичная фульгурация в смысле, объясненном на с. 270, посредством установления новой связи между уже существовавшими механизмами, способными действовать независимо друг от друга. Мы уже познакомились с функцией каждого из этих составляющих механизмов.

Комплекс поведения, который Гейнрот назвал свойственным виду импульсивным поведением (arteiegene Triebhandlung), состоит, как мы уже знаем, из аппетентного поведения срабатывания врожденного механизма запуска и выполнения генетически запрограммированной последовательности поведения с достижением в конце ее завершающей ситуации, удовлетворяющей побуждение. Эта цепь из трех отдельных процессов представляет основу, из которой возникло все обучение посредством проб и ошибок (conditioning). Линейная последовательность процессов приобретает новые неожиданные системные свойства вследствие поистине эпохального «изобретения»: конечный успех последовательности начинает производить обратное модифицирующее воздействие на ведущие к нему формы поведения.

Формы поиска, более или менее случайно входившие в аппетентное поведение, усиливаются этим обратным воздействием, если выполнение всей последовательности достигает успеха, способствующего сохранению вида, а в противном случае ослабляются. Иными словами: успех действует, как то, что обычно называется «вознаграждением», а неудача — как то, что называется «наказанием». В литературе на английском языке все ведущее таким образом к усилению или к "положительной дрессировке" предыдущего поведения называется reinforcement,[80] и, к сожалению, это слово употребляется также пишущими по-немецки психологами; напрашивающиеся немецкие термины отвергаются ими как «субъективистские». Поскольку это понятие восходит к Ивану Петровичу Павлову, я попросил одну из моих сотрудниц, хорошо говорящую по-русски найти у этого автора, где он впервые употребил соответствующий термин и как он звучал по-русски. Оказалось, что великий физиолог написал свои ранние работы, где он ввел это понятие, по-немецки, использовав слова "Verstärkung"[81] u "verstärken".[82] Этот выбор немецкого выражения кажется мне не вполне удовлетворительным. То, что достигается рассматриваемым процессом обучения, можно лучше всего выразить, сказав, что успех подкрепляет[83] поведение животного, ведущее к нему.

Вместе с новой обратной связью возникает когнитивный процесс, доставляющий индивиду за один раз больше прочного знания, чем метод генома мог бы доставить, в самом благоприятном случае, в течение целого поколения, — по меньшей мере вдвое больше, поскольку этот процесс может извлекать информацию не только из успеха, как геном, но также и из неудачи. Кроме того, рассматриваемый процесс действует не так, как геном, «пробующий» наудачу всевозможные существенные и несущественные факторы, а опирается на надежно испытанные врожденные рабочие гипотезы, а именно на те, которые прочно встроены в систему поведения всех высших животных в виде механизмов приобретения текущей информации, описанных в главе 4. Тем самым поведение, модифицируемое методом проб и ошибок, заранее направляется в сторону большей вероятности успеха. Не случайно «заранее» по-латыни звучит "a priori".[84] Мы узнаем об этом больше в разделах, посвященных пониманию и обучению.

Ввиду большой эффективности возникающего таким образом нового когнитивного аппарата понятно, что из быстро движущихся высших животных способны к конкуренции лишь те, которые им обладают.

2. МИНИМАЛЬНАЯ СЛОЖНОСТЬ СИСТЕМЫ

С другой стороны, из сказанного понятно, почему обучение посредством успеха не могло возникнуть у одноклеточных и низших многоклеточных животных, лишенных центральной нервной системы. Система, способная оценить как источник знания успех или неудачу некоторой предыдущей формы поведения и применить результат такой оценки для обратного модифицирующего действия на механизм этой формы поведения, имеет, разумеется, своей предпосылкой существование нескольких не слишком простых, весьма эффективно действующих подсистем. Эти подсистемы и их образ действия мы рассмотрели при обсуждении свойственного виду импульсивного поведения.

Легче всего представить себе механизм, подкрепляющий животное в тех формах поведения, которые ведут к простому удовлетворению потребностей тканей. В этом случае достаточен был бы единственный "датчик",[85] регистрирующий наличие или отсутствие некоторого необходимого для жизни вещества и посылающий свое сообщение в аппарат предыдущего поведения. Такая простейшая возможность подлинной условной реакции и в самом деле осуществляется в отдельных случаях, например, по наблюдениям Детье, при добывании пищи у многих мух. Но, вообще говоря, для большинства систем поведения, адаптивно модифицируемых подлинным обучением, должны быть выполнены следующие три предпосылки.

Во-первых. Форма поведения, с которой начинается все действие, должна быть "широко открытой", т. е. иметь программу, предоставляющую возможность разнообразных адаптивных модификаций; как мы уже знаем, такая программа предполагает особенно большой запас генетической информации.

Во-вторых. Должна каким-то образом "заноситься в протокол" или «запоминаться» форма, какую имели вводные звенья цепи действий при ее последнем выполнении, и эта запись должна связываться с обратным сообщением об успехе.

вернуться

79

Конвергентное приспособление. — Конвергенцией (от лат. converge — сближаюсь, схожусь) в биологии называется образование сходных признаков в независимо эволюционирующих группах организмов.

вернуться

80

Усиление (англ.).

вернуться

81

Усиление (нем.).

вернуться

82

Усиливать (нем.).

вернуться

83

…успех подкрепляет поведение животного. — В подлиннике — bestärkt. Согласно "Большому немецко-русскому словарю" (М.: Русский язык, 1980), bestärken означает подкреплять, подтверждать (что-либо), утверждать, укреплять, поддерживать (в чем-либо); то же в Немецко-русском словаре И. Я. Павловского (Рига, 1911). Verstärken переводится в этих словарях как усиливать, укреплять; подкреплять; утолщать, соответственно усиливать, увеличивать, подкреплять. Термин И. П. Павлова делает акцент на «усилении», а предлагаемый Лоренцем — на "подкреплении".

вернуться

84

По-латыни одно из значений прилагательного prior — "более значительный" или "лучший".

вернуться

85

"Датчик" — в подлиннике "Fühler", "чувствователь".

28
{"b":"110060","o":1}