Поэтому я обратился с вопросом к разработчикам антиспамовой защиты Яндекса, опубликовавшим статью "Принципы и технические методы работы с незапрашиваемой корреспонденцией" , - И. Сегаловичу, Д. Тейблюму, А. Дилевскому, а также разработчику языков программирования и компьютерных программ различного назначения, в том числе антиспамовых фильтров, писателю и художнику Полу Грэму (очень рекомендую его статью "Хакеры и художники" ). Я спросил, считают ли они, основываясь на своем опыте, что возможными направлениями развития искусственного интеллекта может стать разработка систем: а) противодействующих обучению других систем искусственного интеллекта; б) обучающихся в условиях противодействия. От российских авторов я не получил отклика (возможно, из-за надежной работы антиспамовых фильтров Яндекса). Грэм ответил утвердительно на обе части вопроса и подчеркнул: спамовые фильтры сейчас разрабатываются так, чтобы в процессе обучения их было трудно обмануть, и в целом в большинстве областей искусственного интеллекта решения будут такими, чтобы избежать обмана.
Бесплатно
Зарубежная фирма предложила Государственному научному центру РФ "Физико-энергетический институт" бесплатное обучение технологии компьютерных расчетов для атомных электростанций. При юридической экспертизе оказалось, что в случае принятия предложения фирма может, пользуясь правом интеллектуальной собственности, наложить вето на любую международную сделку института, в которой использовалась эта технология. Глава Центра охарактеризовал это обучение как средство "закабаления конкурента" [Коновалова И., Коновалов Б. Все на Продажу // Вечерняя Москва. №28 (22313). 5 февраля 1998. С. 6.]. В данном примере важно, что чем качественнее и универсальнее было бы исходное обучение и чем шире обучаемые использовали его результаты, тем масштабнее и разрушительней стал бы эффект последующих действий стороны, организовавшей обучение. Это обучение должно было стать поистине троянским.
Управление обучаемостью
Подчеркнем, что речь идет именно об управлении обучаемостью, а не об управлении обучением. Ведь пытаться управлять обучением человека (интеллектуальной системы, программного агента) как процессом приобретения им тех или иных знаний, умений, навыков можно и не прибегая к изменению его обучаемости. Многие виды животных целенаправленно учат своих детенышей. Но нет никаких данных, что они целенаправленно управляют их обучаемостью - хотя стихийно, вероятно, влияют на нее.
Целенаправленная разработка и реализация программ повышения обучаемости "учись учиться" - это прерогатива человека и, возможно, созданных им искусственных систем.
Для того чтобы поставить задачу повышения обучаемости одних субъектов (программных агентов и т. д.) и понижения обучаемости других, необходимо иметь достаточно развитую теорию обучения, которая постулирует изменчивость обучаемости[Не всякая теория обучения постулирует изменчивость обучаемости. Обучаемость может пониматься и как неизменное качество на протяжении существования субъекта, например, в силу жесткой генетической детерминации.], описывает факторы, влияющие на нее, а также содержит еще один принципиально важный компонент. Это представления об особенностях обучаемости и интеллекта именно того объекта (человека, социальной группы, технической системы), на который направлены позитивные или негативные обучающие воздействия.
Припомним здесь снова две сказки: в одной лиса учит волка, как ловить рыбу на собственный хвост в проруби, а в другой баба-яга учит Иванушку садиться на лопату, намереваясь отправить его в печь.
Результаты, как известно, оказались противоположными для организаторов обучения. Волк, как и хотела лиса, примерз к проруби, лишился хвоста и еле ноги унес от разъяренных селян, сама же она осталась при барышах. А у бабы-яги, в отличие от лисы, дела сложились не так хорошо. Эта "организаторша обучения" погорела в прямом и переносном смысле на том, что Иванушка, всячески подчеркивая свою крайне низкую обучаемость, попросил ее продемонстрировать лично, как же надо садиться на лопату.
В обоих случаях в выигрыше оказался тот, кто лучше представлял себе, что делается в голове у другого: каков его интеллект и на что его можно спровоцировать, в том числе (или даже - прежде всего) в процессе обучения.
Для анализа сказочных, а также вполне реальных ситуаций такого рода больше всего подходит понятие рефлексивного управления соперником и понятие "формирование доктрины противника посредством его обучения", которые отечественный психолог и математик Владимир Александрович Лефевр ввел сорок лет назад в своей теории конфликтующих структур [Лефевр В. А. Конфликтующие структуры . - М.: Ин-т психологии РАН, 2000]. (В 1974 году он эмигрировал в США и ныне работает в Институте математических наук о поведении - Institute for Mathematical Behavioral Sciences, Университет Калифорнии.)
Рефлексия в его теории понимается как размышления о мышлении другого человека. Глубина рефлексии, или ее ранг, определяется длиной цепочки рассуждений: "Я думаю, что ты думаешь, что он подумал..." и т. д. В антагонистических играх рефлексия может способствовать успеху более продвинутого игрока, ломая при этом объективно имевшиеся отношения превосходства и переворачивая казавшуюся незыблемой иерархию. Можно ожидать, что и в троянском обучении, и в защите от него более успешными тоже будут те интеллектуальные системы, в которые встроена рефлексивная способность - способность разбираться в чужом устройстве обучаемости.
В заключение подчеркнем следующее. Разработка конкурентных сред, в которых конкуренция агентов за более высокие уровни обучаемости является одной из ключевых характеристик среды, может стать важным направлением практической и исследовательской деятельности. Цель может состоять в разработке конкурентных сред, позволяющих генерировать и отбирать интеллектуальных агентов с оптимальными способностями к обучению.