Также интересно отметить, что в рамках нашего определения многие очень простые механические устройства выказывают по меньшей мере феномен нулевого обучения. Вопрос, следовательно, не в том, "могут ли машины учиться", а в том, какого уровня обучения достигла данная машина. Стоит уделить внимание экстремальному, хотя и гипотетическому, случаю.
"Игрок" в игре фон Неймана есть математическая фикция, сравнимая с евклидовой прямой в геометрии или ньютоновской частицей в физике. По определению, "игрок" способен выполнить все вычисления, необходимые для решения любой проблемы, возникающей в игре; он не способен не выполнить эти вычисления там, где они необходимы; он всегда подчиняется результатам своих вычислений. Такой "игрок" получает информацию от событий игры и действует в соответствии с этой информацией. Но его обучение ограничено тем, что здесь называется нулевым обучением.
Исследование этой формальной фикции расширяет наше определение нулевого обучения.
(1) От событий игры "игрок" может получать информацию более высокого или более низкого логического типа и использовать эту информацию для принятия решений более высокого или более низкого уровня. То есть его решения могут быть либо стратегическими, либо тактическими, и он может идентифицировать и отвечать как на тактические, так и на стратегические действия своего противника. Однако верно, что в формальном определении игры фон Неймана все проблемы, предоставляемые игрой, считаются вычислимыми, т.е. хотя игра и может содержать проблемы и информацию многих различных логических типов, иерархия этих типов строго конечна.
Становится ясно, что определение нулевого обучения не зависит ни от логической типизации получаемой организмом информации, ни от логической типизации принимаемых организмом адаптивных решений. Очень высокий (однако конечный) порядок сложности может характеризовать адаптивное поведение, не базирующееся ни на чем, превышающем нулевое обучение.
(2) "Игрок" может вычислить ценность полезной для себя информации, а также вычислить, что эта информация стоит того, чтобы ее получить путем "разведывательных" ходов. Или же он может делать пустые и пробные ходы в ожидании нужной информации.
Из этого следует, что крыса, занятая исследовательским поведением, может делать это на базе нулевого обучения.
(3) "Игрок" может вычислить, что ему могут быть выгодны случайные ходы. При игре в монетку он может вычислить, что, выбирая "орел" или "решку" случайным образом, он будет иметь равный шанс на победу. Если он использует некоторый план, то этот план проявится как паттерн (избыточность) в последовательности его ходов и его противник получит таким образом информацию. Следовательно, "игрок" выберет случайную игру.
(4) "Игрок" не способен на "ошибку". Он может (по серьезным причинам) делать случайные либо разведывательные ходы, но он по определению не способен "учиться методом проб и ошибок".
Если мы полагаем, что в названии этого учебного процесса слово "ошибка" означает то же, что мы имели в виду, когда говорили, что "игрок" не способен на ошибку, тогда "пробы и ошибки" исключаются из репертуара "игрока" фон Неймана. Фактически "игрок" фон Неймана заставляет нас очень тщательно исследовать то, что мы имеем в виду под "обучением методом проб и ошибок", а также, разумеется, всего, что имеется в виду под обучением любого рода. Предположение, связанное со значением слова "ошибка", нетривиально и должно быть исследовано.
В определенном смысле "игрок" может ошибаться. Например, он может принять решение по вероятностным соображениям и затем сделать ход, который в свете ограниченной доступной информации является правильным с наибольшей вероятностью. Когда же становится доступно больше информации, он может обнаружить, что ход был ошибочным. Но это открытие ничего не может прибавить к его будущим навыкам. По определению, игрок правильно использовал всю доступную информацию. Он правильно оценил вероятности и сделал ход, который был правильным с наибольшей вероятностью. Открытие того, что в некоторый момент он ошибся, не может иметь отношения к будущим ситуациям. Если впоследствии возникнет та же проблема, он проделает те же вычисления, придет к тем же решениям и будет прав. Более того, набор альтернатив, из которого он будет делать свой выбор, будет все тем же набором. И это правильно.
По контрасту, организм способен ошибаться многими "способами", на которые "игрок" не способен. Эти неправильные выборы уместно назвать "ошибками" в том случае, когда они имеют такой характер, что дают организму информацию, способную увеличивать его будущие навыки. Во всех этих случаях некоторая доступная информация либо игнорируется, либо используется некорректно. Можно классифицировать различные виды таких полезных ошибок.
Предположим, что внешнее событие содержит детали, которые могут сообщить организму:
a) из какого набора альтернатив он должен выбрать свой следующий ход;
b) какой элемент этого набора он должен выбрать. Такая ситуация допускает двоякого рода ошибки:
(1) организм может правильно использовать информацию, которая говорит, из какого набора альтернатив он должен выбрать, но выбрать неправильную альтернативу внутри этого набора;
(2) он может выбрать из неправильного набора альтернатив.
(Имеется также интересный класс случаев, в которых наборы альтернатив содержат общие элементы. Поэтому для организма есть возможность быть "правым", но по ошибочным причинам. Эта форма ошибки неизбежно является самоусиливающейся.)
Если теперь принять общее положение, что любое обучение, отличное от нулевого обучения, в некоторой степени сто-хастично (т.е. содержит компоненты "проб и ошибок"), то из этого следует, что упорядочение процесса обучения может быть построено на иерархической классификации типов ошибок, которые должны быть исправлены в различных учебных процессах. Нулевое обучение станет тогда обозначением для непосредственной основы всех тех актов (простых и сложных), которые не корректируются методом проб и ошибок; обучение-I будет уместным обозначением для пересмотра выбора внутри неизменного набора альтернатив; обучение-II будет обозначать пересмотр набора, из которого делается выбор, и т.д.
Обучение-I
Следуя формальной аналогии, задаваемой "законами" движения (т.е. "правилами" описания движений), мы попытаемся найти класс явлений, описание которого соответствует изменениям при нулевом обучении (так "движение" описывает изменение положения). Это случаи, при которых объект во время t=2 дает другой отклик, нежели во время t=1. Тут мы снова сталкиваемся со множеством случаев, различно связанных с опытом, физиологией, генетикой и механическими процессами.
(a) Существует феномен привыкания, т.е. замены ответа на каждое появление повторяющегося события на отсутствие Явного ответа. Существует также угасание (или потеря) привыкания, которое может произойти в результате более или менее длительного перерыва в последовательности повторений события-стимула. (Привыкание представляет особый интерес. Специфичность отклика, которую мы называем нулевым обучением, характерна для любой протоплазмы, однако интересно отметить, что "привыкание" -это, возможно, единственная форма обучения-I, которую живые существа могут достигать без обладания нервной цепью.)
(b) Самый знакомый и, возможно, самый изученный случай - это классическое павловское обусловливание. При t=2 собака выделяет слюну в ответ на звонок; она не делает этого при t=1.
(c) Существует "обучение", возникающее в контексте инструментального поощрения и инструментального избегания.
(d) Существует феномен обучения путем многократного повторения (rote learning), в котором одна единица поведения организма становится стимулом для другой единицы поведения.
(e) Существует обрыв (угасание или подавление) "завершенного" обучения, который может последовать за изменением или отсутствием подкрепления.
Одним словом, список видов обучения-I содержит то, что обычно и называют "обучением" в психологических лабораториях.