Привет, меня зовут Алина, и я нейрохудожник. В ТГ-канале «Параллельные издания» я выкладываю свои работы, сгенерированные в нейросети. Вы можете по-разному относиться к предыдущей фразе: с презрением («не может быть СВОИХ работ из НЕЙРОсети»), с негодованием («Я тоже рисую в нейросети, но не заявляю, что я нейрохудожник»), с интересом («Ого, почитаю, а то у меня не получается нарисовать то, что хочу») и даже благоговением («У меня до сих пор руки не дошли что-то нарисовать в нейросети, а человек уже нейрохудожником стал»). Прежде, чем спорить о праве называться нейрохудожником, стоит сперва ответить на более общий вопрос: а можно ли называть искусством генерацию изображений в нейросети?
Ничто не ново под луной: дискуссии об искусстве тянутся испокон веков. В эпоху Возрождения разгорелся спор между реалистами и идеалистами о том, что первично — идеи или видимый мир — и малые голландцы, мастера жанровой живописи, подвергались критике за то, что их картины не соответствовали идеалам и часто изображали повседневную жизнь. В XIX веке фотографии считались механическими репродукциями реальности, лишенными души и творчества. В первые десятилетия XX века фильмы считались развлекательным зрелищем, а не искусством, пока не вышли фильмы «Рождение нации» (1915) и «Броненосец Потемкин» (1925).
В этой статье на примере цифрового искусства я разберу смысл изображения на составляющие части и соберу его заново, показав, как при помощи нейросети мы слой за слоем можем усложнять иллюстрацию. С каждым новым наложенным пластом информации мозг будет считывать изображение как более интересное и глубокое. Помимо транслирования моих взглядов на нейроискусство статья несёт практическую пользу. Я буду приводить промты, то есть текстовые запросы для генерации изображений, в одной из нейросетей — Midjourney — на примере цветка кувшинки. Для использования промтов под свои нужды нужно будет заменить слова «water lily» на любой другой объект.
На примере кино проще всего объяснить, какое произведение мы назовем искусством: то, в котором зритель увидит несколько пластов.
Романтический вечер, влюбленные сидят за столиком при свечах, герой говорит героине: «Я люблю тебя». И если он под этими словами подразумевает, что он её любит, то это не искусство: когда автор описывает ровно то, что происходит, а герои говорят ровно то, что думают, это лишь первый слой, «высказанное» — идеи и чувства, которые герой решается открыть другим.
В хорошем кино зритель услышит второй слой, «невысказанное» — мысли и чувства, которые герой произносит внутренним голосом и только себе самому. «Я не уверен, как ты примешь эти слова и что они значат для тебя», «Пожалуйста, только не отталкивай меня» или даже «Надеюсь, ты попадешься на крючок».
Третий слой, «невысказываемое» — неосознанные желания и страсти, которые герой не может выразить словами даже себе, потому что они слишком смутны и трудно определимы. «Мне нужно быть хоть с кем-то, я не могу быть один», «Когда на меня не обращают внимание, я хочу умереть» или даже «Я должен добиваться недоступных женщин, чтобы чувствовать себя уверенно».
Иногда может быть ещё и четвертый слой — за всеми переживаниями героя можно разглядеть позицию режиссера, который уже знает, что суждено героям: совместное счастье или разлука.
Если вы увидели разницу между представленными изображениями и почувствовали, что разные кадры влюбленной пары несут разное наполнение, тогда вам будет интересно дочитать эту статью.
Цифровое искусство — это форма искусства, созданная с использованием компьютерных технологий или цифровых устройств. Оно может включать в себя различные формы, такие как компьютерная графика, цифровая живопись, анимация, мультимедийное искусство, цифровая фотография и даже интерактивные инсталляции. Цифровые художники используют специальные программы и инструменты для создания своих произведений.
Нейрохудожник создает цифровое изображение, но только определенным способом — превращая текст в изображение в нейросети. Однако самое главное отличие нейрохудожников от всех остальных мастеров не в уникальности работы с нейросетью: создавать изображение из текста может научиться каждый, кто умеет печатать. Я вижу несколько характерных особенностей работы именно нейрохудожника:
Широкий арсенал техник и инструментов, накопленных за всю историю человечества. Для его использования надо постоянно расширять свой кругозор.
Возможность тренировать нейросеть и прокачивать её мастерство — причем не в одиночку. Техника исполнения находится вне художника и над её улучшением работают все пользователи нейросети.
Из предыдущего пункта следует, что ты никогда не можешь получить одинаковое изображение из одного промта. Они будут похожи, но всегда отличаться, а с течением времени даже меняться.
По мере расширения арсенала и кругозора нейрохудожник способен довольно быстро по сравнению с остальными творческими людьми прокачать насмотренность.
Ниже я рассмотрю три смысла, которые я вкладываю в понятие цифрового искусства и предоставлю промты для генерации каждого. Потом я объединю промты, чтобы показать, что изображение становится интереснее и сложнее, его хочется разглядывать, о нем хочется думать и делать выводы. Я приведу примеры использования таких изображений в статьях на айти-тематику. И, наконец, сделаю вывод о том, можно ли считать это всё искусством.
Мне сложно представить пустоту, предшествовавшую Большому Взрыву. Однако даже когда я была далека от программирования, я понимала, что в виртуальном мире объект можно создавать из ничего и окруженным ничем. Глубокая темень, таящая в себе миллиарды возможностей — так я представляю себе плодородную почву для выращивания цифровых цветов. Вот несколько способов изобразить пустоту.
Я не могу без микроскопа разглядеть даже молекулу и клетку, не говоря уж об атомах и кварках, поэтому физический мир представляется в сознании достаточно целостным. Однако когда я думаю о цифровом мире, я представляю Нео из Матрицы, окруженного зелёными цифрами, и старые компьютерные игры с огромными пикселями. Характерный признак виртуального изображения — его декомпозируемость на ячейки, причем не все ячейки могут быть заполнены. Виртуальный цветок берет свое начало необязательно из корня: он может начаться и с лепестка.
Кстати, ASCII-графика, на которую я ссылаюсь в данном промте — показательный пример того, как название в промте не соответствует результату. Это изображение больше походит на Майнкрафт, чем на эски графику, однако результат соответствует моим целям, поэтому я использую именно этот промт.
Первые два пункта — пустота и частицы — можно отнести и к картине, нарисованной на листе. Так что же отличает цифровое искусство? Оно проектируется и создается для того, чтобы быть отображенным на экране. На экране могут быть помехи, зернистость, неестественные цвета, блики, разный контраст и яркость, экран может разбиться. Водная лилия берет свое начало из глубины, но распускается на поверхности пруда. Отображение — финальный слой смысла, который я вижу в цифровом искусстве.
Теперь я покажу эффекты, которые дают комбинации разных промтов из трех приведенных выше групп. Отдельные промты показали себя особенно устойчивыми и предсказуемыми, поэтому к ним я приложу несколько удачных изображений, а не одно.
При объединении на одной картине пустоты и частиц я угадываю процесс того, как цветок кувшинки создается буквально у меня на глазах и вот-вот сформируется, обретя форму.
По точным координатам пиксели на экране — в процессе передачи сигналов с тонкопленочных транзисторов на жидкокристаллические панели — отражают результаты трудов: цветок, проявляющийся на границе реального и виртуального миров. Изображение на этих картинах более статичное, хотя и кажется, будто вот-вот рассыпется.
В этой комбинации промтов нет ничего о пикселях и цифровом коде: целостная картинка бьётся об экран прямиком из пустоты. Цифровой цветок, который выпрыгнул на поверхность минуя процесс сотворения и оттого еще не сформировался, оставляет ощущение незавершенности и большой скорости.
Совмещение трех стилей в промтах притягивает взгляд и выглядит сложнее, чем все предыдущие картины.
Все картинки выше было бы невозможно создать, если бы десятки тысяч людей со всего мира не генерировали в Midjourney изображения в соответствии со своими представлениями о прекрасном. Как нейрохудожник я часто тренирую нейросеть: отбираю лучшие изображения, увеличиваю их, создаю вариации и делаю так снова и снова, пока нейросеть не обучится создавать по определенному промту ожидаемый результат.
Вот, например, мой промт, на обучение которому я потратила полгода назад несколько вечеров:
С тех пор нейросеть развилась и сочетание «Nick Veasey» и «dotted pattern projecting texture» дает потрясающие результаты.
А вот другой промт. Несколько месяцев назад я тренировала нейросеть создавать цветок магнолии в процессе проектирования:
Промт до сих пор не очень устойчивый, хотя мне удалось добиться похожего результата для кувшинки:
Кстати, а что будет, если использовать все указанные мной 15 стилей в одном промте?
Как видите, ничего особенного в этом изображении по сравнению с предыдущими нет. Написание промтов — это не та область, в которой количество переходит в качество.
У Рене Магритта есть картина «Вероломство образов», на которой изображена курительная трубка с надписью «Это не трубка», потому что это не сама трубка, а ее образ. Вот, что говорил сам Магритт: «Эта знаменитая трубка. Как люди попрекали меня ей! И всё же, вы можете набить её табаком? Нет, это ведь всего лишь изображение, не так ли? Так что, если бы я написал под картиной „Это трубка“, я бы солгал!»
В промтах выше я не учу создавать цифровое искусство, а показываю, как создать изображение, которое бы указывало на то, что это искусство — цифровое. Такие картинки можно использовать в статьях и рекламе для описания цифровых продуктов, делая акцент на их создании, содержании или отображении. Ниже я приведу примеры на основе всё тех же 15 стилей, которые я указала выше, хотя их существует несколько тысяч. За время своей работы я использовала более тысячи стилей.
Например, если я хочу рассказать о том, как наша фирма создавала логистическую систему для транспортной компании, я подсвечу в изображении процесс проектирования.
Если я рассказываю о характеристиках системы, я покажу ее устойчивой и осязаемой, при этом не убирая фокусировку с того, что это цифровой продукт. Вот так бы я подчеркнула надежность системы в любых условиях.
А вот так — скорость.
А с помощью следующей иллюстрации я бы намекнула, что разработки конкурентов не отличаются высоким качеством.
Возьмем другой пример — приложение для знакомств. Если пользователям важен подбор партнера по анализу совместимости, я бы сделала акцент на лежащих в его основе алгоритмах.
Если пользователи ищут разовые свидания, я бы добавила цвет — для страсти.
Если пользователи ищут долгосрочные отношения и брак, я бы дополнительно нанесла слой старомодности.
А, быть может, кто-то ожидает историю любви, как в кино?
Я постаралась описать, как нейрохудожник может добиваться нужного впечатления в зависимости от контекста, но это всё ещё не искусство, а визуализации и рекламные изображения. Так что же сделает нейроизображения искусством? Ровно то же самое, что делает искусством картину, фотографию или кино. Это способность художника убрать от холста кисть, когда картина закончена; способность фотографа в нужный момент нажать на спуск затвора; способность режиссера выстроить кадр и начать снимать. Сочетание технического мастерства и творческой интуиции называется авторским взглядом.
Авторский взгляд отличается тем, что его эффект на зрителя невозможно предугадать: картина живет своей жизнью, в ней не три и не четыре смысла, а тысячи. Не все пласты мы можем разделить и отрефлексировать, но подсознательно мы их понимаем. Умению видеть нельзя научить, но в его основе лежит сама суть нейросети: тренировка насмотренности на лучших работах.
Импрессионист Клод Моне писал цикл «Кувшинки» из 250 картин в течение 30 лет. Я посмотрела 240 изображений кувшинок на основе 60 разных техник за 3 часа. В статью попала десятая часть. Из 240 картинок у меня получилось только три изображения, из которых можно развить авторский стиль. Они получились случайно, их не удается воспроизвести, а, значит, я буду тренировать нейросеть: создавать вариации этих изображений, выбирать, увеличивать лучшие.
За полтора года работы в Миджорни я много раз тренировала нейросеть и выработала несколько собственных техник, многие из них сложносоставные: например, надо переводить изображение из одной версии Миджорни в другую или наслаивать изображения друг на друга. Вот три промта, которые я использую в версиях Миджорни v 6 или v 3:
… in the style of Wong Kar-wai
Sam Toft’s illustration of a …
Nick Veasey’s clean, sketch-style illustration depicting a … --weird 100
Получившееся изображение использую с другим промтом в другой версии, чтобы добиться нужного мне эффекта. Ниже я приведу несколько работ в своём стиле.
Все изображения сделаны в разных техниках и разными промтами, но их объединяет мой взгляд: я люблю приглушенный свет, небрежность и одиночество.
Если вам интересно продолжить исследование темы нейроискусства, приглашаю в свой ТГ-канал «Параллельные издания».