С этой точки зрения единственное, что может придать битам смысл, — это то, что их структуры претерпели так много столкновений с реальностью, что их нельзя больше по-настоящему абстрагировать, они стали неабстрактным продолжением реальности.
Реализм основан на частностях, но мы пока не знаем и можем никогда не узнать частностей индивидуальности с вычислительной точки зрения. Максимум, что мы сегодня можем, — это начать рассказывать истории типа тех, которые иногда нам рассказывают эволюционные биологи.
Со временем данные и проницательность могут сделать историю более конкретной, но на текущий момент мы по меньшей мере способны рассказать правдоподобную историю самих себя в терминах широкомасштабной вычислительной истории природы. Миф, сказка сотворения, может, чтобы дать нам способ думать вычислительно, пока оставаться не настолько подверженным искажениям, привносимым нашими идеями об идеальных компьютерах (т. е. тех компьютерах, которые могут обрабатывать лишь небольшие программы).
Такое изложение сказок есть спекуляция, но спекуляция с определенной целью. Приятным бонусом этого подхода является то, что конкретика имеет тенденцию быть более красочной, чем обобщения, поэтому вместо алгоритмов и гипотетических абстрактных компьютеров мы рассматриваем певчих птиц, изменяющих форму головоногих и метафоры Шекспира.
Глава 13
Рассказ о возможном ходе развития семантики
В этой главе представлено прагматичное чередование философских взглядов (в противоположность требованию, чтобы единая философия применялась всегда без исключения). В натуралистических рассуждениях об истоках семантики используется вычислительный подход.
Наконец-то компьютеры начинают распознавать образы
В январе 2002 года меня пригласили выступить с вступительной речью и лекцией перед Национальной ассоциацией производителей музыкальных инструментов [21]на их ежегодной выставке. Я продемонстрировал ударный ритм с помощью быстрой смены самых забавных гримас, которые только мог придумать.
Компьютер фиксировал выражение моего лица через видеокамеру и генерировал обидные ударные звуки в соответствии с той гримасой, которую он распознавал в каждый момент. [22](Отбивать ритм с помощью смены выражений лица ново и забавно — думаю, вскоре молодежь возьмет на вооружение этот трюк.)
Этот вроде бы легкомысленный эпизод нужно воспринимать всерьез как индикатор технологических перемен. В ближайшие годы распознавание образов, например выражений лица, войдет в повседневную практику. С одной стороны, это означает, что нам придется изменить политику общества в отношении неприкосновенности частной жизни, поскольку гипотетически сеть камер видеонаблюдения получит возможность автоматически определять, где находится любой человек и какое у него выражение лица, однако существует и множество других невероятных возможностей. Представьте себе, что ваш аватар в Second Life (или, что еще лучше, в полностью реализованной, погружающей виртуальной реальности) передает всю вашу мимику.
Однако до недавнего времени компьютеры даже не могли распознать улыбку. Мимика была глубоко упрятана в неточном понятии качества и весьма далеко от другого полюса — абсолютно определенного понятия количества. Ни одна улыбка не похожа на другую, и невозможно сказать, что общего во всех них. Подобие — это субъективное ощущение, интересующее поэтов, но безразличное для разработчиков программного обеспечения.
Хотя и существует множество качеств, которые нельзя передать с помощью программного обеспечения, используя имеющиеся на настоящий момент средства, инженеры наконец-то смогли создать программу, способную распознать улыбку, и написать код, который улавливает хотя бы часть того, что объединяет все улыбки. Данная незапланированная трансформация наших возможностей произошла на рубеже столетий. Я не был уверен, что доживу до этого события, хотя меня не перестает удивлять, что инженеры и ученые, с которыми я периодически сталкиваюсь, не осознают, что именно произошло.
РАСПОЗНАВАНИЕ МИМИКИ ИМЕЕТ И БОЛЕЕ ГЛУБОКИЙ СМЫСЛ. МНОГИЕ ГОДЫ СУЩЕСТВОВАЛА ЧЕТКАЯ И НЕИЗМЕННАЯ ГРАНЬ МЕЖДУ ТЕМ, ЧТО МОЖНО И ЧЕГО НЕЛЬЗЯ ПРЕДСТАВИТЬ ИЛИ РАСПОЗНАТЬ С ПОМОЩЬЮ КОМПЬЮТЕРА. МОЖНО ПРЕДСТАВИТЬ ОПРЕДЕЛЕННОЕ КОЛИЧЕСТВЕННОЕ ПОНЯТИЕ, НАПРИМЕР ЧИСЛО, НО НЕВОЗМОЖНО ПРЕДСТАВИТЬ ПРИБЛИЗИТЕЛЬНОЕ ЦЕЛОСТНОЕ КАЧЕСТВО, ТАКОЕ КАК ВЫРАЖЕНИЕ ЛИЦА.
Технология распознавания образов и неврология развиваются вместе. Программа, которую я использовал для НАПМИ, служит прекрасным подтверждением этого. Неврология может достаточно быстро подтолкнуть развитие технологии. Изначально данный проект стартовал в 1990-е годы под эгидой ученого-невролога из Университета Южной Калифорнии Кристофа фон дер Мальсбурга, работавшего с группой своих студентов, в частности, с Хартмутом Невеном. (Фон дер Мальсбург более всего известен своим замечательным наблюдением, сделанным в начале 1980-х: синхронное возбуждение нейронов, когда многочисленные нейроны проводят электрические импульсы одновременно, важно для способа функционирования нейронных сетей.)
В данном случае он работал над ответом на вопрос, какие функции выполняются отдельными участками ткани в зрительной коре — той части мозга, которая первой получает изображение с оптических нервов. В настоящее время не существует инструмента, способного детально определить, что происходит в большой сложной нейронной сети, в особенности если последняя является частью живого мозга. Поэтому ученым приходится изыскивать иные пути для проверки своих гипотез о том, что же в ней происходит.
Одним из таких путей является построение компьютерной модели для проверки работы гипотезы. Если гипотеза о том, как функционирует часть мозга, инспирирует создание работающей технологии, эта гипотеза определенно имеет право на существование. Однако неясно, насколько она верна. Вычислительная неврология находится на нечеткой грани научного метода. Казалось бы, программа распознавания мимики сокращает степень неопределенности, присутствующую в человеческой натуре, но фактически она может не сократить, а усилить эту неопределенность. Дело в том, что программа приближает ученых и инженеров к тому состоянию, когда наука постепенно начинает использовать методы, близкие к поэзии и прозе. Правила, используемые программой, несколько неопределенны и останутся таковыми до тех пор, пока мы не получим более точные данные о функциях нейронов в живом мозге.
Впервые мы можем рассказать хотя бы в общих чертах, как мозг распознает образы, встречающиеся в мире, например улыбку, хотя мы и не знаем, как доказать, что наше понимание верно. Вот этот рассказ.
Каким кажется мир статистическому алгоритму
Начну со своего детского воспоминания. Когда я рос в пустыне южного Нью-Мехико, я обратил внимание на полосы, оставляемые на грунтовой дороге проезжающими автомобилями. На дороге появлялись волнистые выпуклые поперечные полосы, как вельветовые рубчики, которые представляли собой естественным образом образующуюся бесконечную последовательность «лежачих полицейских». Расстояние между полосами определялось средней скоростью движения автомобилей по этой дороге.
Когда вы ехали с этой средней скоростью, меньше трясло. Полосы были видны лишь на закате, когда горизонтальные красные солнечные лучи высвечивают все неровности на земле. Днем нужно было ехать осторожно, чтобы не пропустить эту информацию, спрятанную на дороге.
Цифровые алгоритмы должны подходить к проблеме распознавания образов подобным косвенным путем, и им часто приходится применять общую процедуру, немного похожую на проезд виртуальных колес по виртуальным неровностям. Она носит название «преобразование Фурье». Преобразование Фурье определяет объем деятельности, проходящий на конкретной «скорости» (частоте) в блоке цифровой информации.