Литмир - Электронная Библиотека
Содержание  
A
A
Охота на электроовец. Большая книга искусственного интеллекта - image278.jpg
Рис. 148. Пример раскраски изображений (слева направо): обесцвеченное изображение,
три варианта раскраски от PixColor, оригинальные цвета

В том же году команда исследователей из Калифорнийского университета в Беркли под руководством профессора Алексея Эфроса представила[2752] свою нейросетевую модель для раскраски изображений. В отличие от Даля и его коллег специалисты из Беркли стремились создать систему, способную выполнять раскраску, используя подсказки от людей. При помощи таких подсказок можно было разрешать возникающие при раскраске неопределённости.

Охота на электроовец. Большая книга искусственного интеллекта - image279.jpg
Рис. 149. Пример раскраски изображений моделью Алексея Эфроса

В наши дни продолжается быстрое развитие моделей для автоматической и полуавтоматической раскраски изображений. За 2020–2021 гг. только в реестре PapersWithCode появилось 82 статьи, посвящённые этой области (для 38 из них доступен исходный код моделей)[2753]. Даже поверхностный обзор этих работ занял бы непростительно много места.

Ну хорошо, допустим, модели глубокого обучения более-менее справились с задачей раскраски изображений. Но способны ли они перейти на новый уровень визуального творчества — скажем, выполнить стилизацию изображения в соответствии с манерой известного художника?

В 2015 г. социальные сети захлестнула волна картинок, на которых привычные предметы превращались в различные части собачьих морд: носы, глаза, лапы. Виной этому стала модель под названием DeepDream, созданная разработчиком из Google Александром Мордвинцевым.

Охота на электроовец. Большая книга искусственного интеллекта - image280.jpg
Рис. 150. Пример «собачьих» метаморфоз изображения в результате работы модели DeepDream

Метаморфозы, которые изображения претерпевали при помощи DeepDream, быстро окрестили «алгоритмической парейдолией». Слово «парейдолия» происходит от древнегреческих слов παρά — рядом, около; отклонение от чего-либо и εἴδωλον — изображение; и означает разновидность зрительных иллюзий, заключающихся в формировании иллюзорных образов на основе деталей реального объекта. Типичный пример парейдолической зрительной иллюзии — восприятие тёмных пятен на видимой поверхности Луны в качестве фигуры зайца или кролика. Считается, что именно эта иллюзия послужила основой для появления в фольклоре разных народов истории о лунном зайце (или кролике). Другой известный пример парейдолии — лицо Марса — образованное причудливой игрой света и тени подобие человеческого лица на ранних фотографиях поверхности Марса.

Склонность человека узнавать знакомые образы издревле популярна у художников. Например, миланский художник XVI в. Джузеппе Арчимбольдо создал сразу несколько картин, основанных на этом эффекте («Времена года», «Четыре стихии», «Повар», «Юрист»). На них портреты людей при ближайшем рассмотрении оказываются нагромождением различных предметов, растений и животных.

Охота на электроовец. Большая книга искусственного интеллекта - image281.jpg
Рис. 151. Четыре картины Джузеппе Арчимбольдо

В DeepDream после обучения сеть используется в обратном направлении, для коррекции изображения, причём таким образом, чтобы увеличить значение на выходе выбранного выходного нейрона (например, «нейрона собаки», т. е. нейрона выходного слоя сети, соответствующего метке класса «собака»). Эта процедура похожа на метод обратного распространения ошибки, однако корректируются не веса, а значения на входе каждого из нейронов. В результате всё, что в исходном изображении «напоминало» сети собаку, начинает «напоминать» её ещё больше, то есть само изображение как бы увеличивает «степень собачности».

Сама идея подобного использования нейросетевых моделей появилась ещё во времена первых успехов свёрточных нейронных сетей. Так, в 1988 г. на Международной конференции IEEE по нейронным сетям (IEEE 1988 International Conference on Neural Networks) была представлена работа Джона Льюиса под названием «Создание путём переработки: творческая парадигма для нейронных сетей, обучаемых методом градиентного спуска» (Creation By Refinement: A Creativity Paradigm for Gradient Descent Learning Networks)[2754]. Статья описывает «парадигму для создания новых экземпляров класса объектов, распознаваемых обученной при помощи метода градиентного спуска ассоциативной сети. Подход состоит из фазы обучения, на которой сеть учится идентифицировать объекты желаемого класса, за которой следует простой алгоритм синтеза, в котором полученное случайным образом „творение“ уточняется путём поиска методом градиентного спуска, дополняющим метод, используемый при обучении».

Удивительно, что в наши дни профессор Льюис известен не как основатель инцепционизма [inceptionism] (так сегодня нередко называют этот подход в искусстве), а как «самый терпеливый человек интернета». Дело в том, что он является владельцем учётной записи @johnlewis в Twitter, и ежегодно сотни пользователей со всего мира по ошибке отправляли ему твиты, предназначенные для сети британских универмагов John Lewis & Partners или члена Палаты представителей США от Джорджии Джона Льюиса. Профессор Льюис с присущими ему юмором и вежливостью перенаправлял отправленные ему сообщения (которых становилось особенно много в канун Рождества), чем заслужил у пользователей соцсети славу самого терпеливого человека в интернете[2755], [2756], [2757]. В 2014 г. сеть универмагов прислала Льюису подарочный набор (игрушечного пингвина Мэйбл и набор для опеки над пингвином от Международного фонда дикой природы) в знак признательности и в качестве извинения за доставленные неудобства[2758].

Всё это, конечно, не умаляет достижений исследователей из Google. После того как компания опубликовала подробное описание алгоритма и выложила в открытый доступ исходный код DeepDream, появилось множество инструментов в виде веб-сервисов, мобильных приложений и программ для персональных компьютеров, позволивших широким народным массам производить эксперименты с собственными изображениями.

Многие другие исследовательские группы занялись созданием собственных улучшенных вариантов DeepDream. Некоторые из этих экспериментов были весьма курьёзными. Например, энтузиаст машинного обучения Габриэль Го, ныне сотрудник OpenAI, использовал для генерации алгоритмических галлюцинаций нейронную сеть, созданную группой исследователей из компании Yahoo!, для обнаружения «взрослого» изобразительного контента. В итоге получился генератор довольно криповых порнографических фантазий[2759].

Рост интереса к алгоритмической парейдолии подстегнул дальнейшие исследования в этой области. В результате появилось множество улучшений исходного подхода (например, были предложены различные способы регуляризации, позволяющие улучшать те или иные качества итоговых изображений), а также были расширены границы его применения. В частности, развитие получили два важных направления в области генеративных моделей — перенос (художественного) стиля [(Artistic) Style Transfer] и семантическая манипуляция изображениями [Semantic Image Manipulation]. Поговорим сначала о первом из них.

вернуться

2752

Zhang R., Zhu J.-Y., Isola P., Geng X., Lin A. S., Yu T., Efros A. A. (2017). Real-Time User-Guided Image Colorization with Learned Deep Priors // https://arxiv.org/abs/1705.02999

вернуться

2753

Colorization (2022) // https://paperswithcode.com/task/colorization/latest, https://paperswithcode.com/task/colorization/codeless#code

вернуться

2754

Lewis J. P. (1988). Creation By Refinement: A Creativity Paradigm for Gradient Descent Learning Networks / IEEE International Conference on Neural Networks // https://doi.org/10.1109/icnn.1988.23933

вернуться

2755

Alice P. (2013). John Lewis, the most patient man on the internet / Daily Telegraph, 11 Nov 2013 // https://www.telegraph.co.uk/news/uknews/10440185/John-Lewis-the-most-patient-man-on-the-internet.html

вернуться

2756

White A. (2015). The Worst Time Of Year For The Most Patient And Polite Man On The Internet Has Begun. We should probably honour him with a statue or something / BuzzFeed, Nov 6, 2015 // https://www.buzzfeed.com/alanwhite/whats-the-definition-of-madness-again

вернуться

2757

Sanusi V. (2016). The Most Patient And Polite Man On The Internet Is Back At It Again / BuzzFeed, Nov 10, 2016 // https://www.buzzfeed.com/victoriasanusi/its-the-worst-time-of-year-for-the-most-patient-and-polite-m

вернуться

2758

Massey N. (2014). Man called John Lewis sent Christmas advert penguin after being bombarded with tweets directed at store / Mirror, 20 Nov 2014 // https://www.mirror.co.uk/news/uk-news/man-called-john-lewis-sent-4658776

вернуться

2759

Vincent J. (2016). This AI program sees genitals everywhere it looks. Do androids dream of electric dicks? / The Verge, Oct 24, 2016 // https://www.theverge.com/2016/10/24/13379208/ai-nsfw-neural-nets-deep-dream-genitals

283
{"b":"936964","o":1}