Мир нейросетей развивается с невероятной скоростью. Ещё вчера генерация изображений по текстовому описанию казалась чем-то фантастическим, а сегодня уже существуют десятки сервисов, соревнующихся в качестве и реалистичности результатов. Но как выбрать инструмент, который подходит именно вам?
В этом обзоре мы не будем загружать вас техническими подробностями и сложными терминами. Мы пойдём другим путём — протестируем популярные нейросети на конкретном задании и посмотрим, кто справится лучше.
Пройдемся по моделям с одним запросом: картинкой для комикса по истории Деда Мазая и зайцев, а именно:
Три кролика в стиле Don't Starve, купаются в пруду, вид сбоку, толстые контуры, темные тени, мрачный и милый стиль, осенняя цветовая палитра, на заднем плане - силуэты деревьев и костры, глаза светятся в темноте, рядом с прудом - разбросанная морковь, ночь
Three rabbits in the style of Don't Starve, bathing in a pond, side view, thick outlines, dark shadows, grim and cute style, autumnal color palette, silhouetted trees and a campfire in the background, eyes glowing in the dark, scattered carrots near the pond, nighttime
Если что, то для сравнения схожести стиля, будем ориентироваться на это:
Что в целом свойственно стилистике игры Don't Starve? Мультипликационная мрачность с элементами готики, что-то напоминающее Тима Бертона; неровные, отчасти рваные контуры; имитирование традишки, например, текстура старой бумаги, рисунок карандашом/углем/тушью; использование приглушенных цветов с контрастными элементами.
Midjourney уже не первый год держит планку королевы нейросетей. 15 миллионов пользователей — впечатляющая цифра, которая говорит сама за себя. И это не просто "мертвые души" — Midjourney живет и активно развивается: ежедневно более миллиона человек создают с её помощью новые изображения.
В чем же секрет такого успеха? Во-первых, Midjourney генерирует действительно классные картинки: четкие, детализированные, с проработанным стилем. Во-вторых, она дает пользователям кучу возможностей для творчества: можно настраивать буквально все — от соотношения сторон до дисперсии, стилей и фильтров.
Конечно, сразу разобраться во всех тонкостях Midjourney может быть непросто. Интерфейс у нее не самый дружелюбный, да и регистрация в Discord — дополнительный квест.
Единственный минус — Midjourney теперь не получишь просто так. Придется раскошелиться на подписку (от 8 долларов в месяц). Но для серьезного творчества — это не такая уж и большая цена, правда?
Я решила воспользоваться BotHub для генерации иллюстрации, ввиду банальной простоты использования Midjourney внутри сервиса, поскольку не всегда есть возможность совершить оплату подписки не с российской карты, да и в целом, когда ты нечастый пользователей того же Midjourney, зачем оплачивать подписку, если можно оплатить только одну генерацию, условно, конечно, но, думаю, суть передала.
Итак, передав наш промт нейросети, мне сгенерировало 4 варианта, оставила наиболее подходящий под запрос:
Не могу сказать, что это точное попадание в стилистику игры, однако, как мне кажется, если поиграть с промтом, можно получить результат совершенно другого уровня и гораздо больше походящий на правду. Но если смотреть в общем: картинка приятная по цветам, мы передали в запрос осенний вайб - и здесь он очень хорошо читается. Все, чего мне не хватает, так это именно имитации традиционных материалов, но, вероятно, это решается корректировкой промта.
Следующий сервис приятный сюрприз для тех, кто ищет мощную и удобную нейросеть для создания изображений, но не готов тратить на это целое состояние. Эта платформа — настоящая находка, особенно для российских пользователей: работает без VPN, да и с щедростью у неё всё в порядке — 500 бесплатных изображений в день.
В основе Playground AI лежит передовая модель Stable Diffusion. Если 500 изображений в день вам окажется мало, всегда можно перейти на премиум-тариф (от 12 долларов) и получить доступ к расширенному функционалу. Единственный момент — с оплатой из России могут быть небольшие сложности.
Итак, посмотрим на изображение по нашему промту:
По стилю рисовки чем-то напоминает эффект масляной краски в фотошопе. Если в общем - то один кролик куда-то пропал, хотя два других выглядят неплохо. Если по промту: кролики "уселись" на берегу, а не в воде; пропали костры и морковь; стилистика сама по себе немного далека от мрачности. Получившаяся картинка отличается от промта, она содержит общие элементы, однако в целом не соответствует нашему промту.
Еще в 2021 OpenAI представила DALL-E. Это была одна из первых нейросетей, которые умеют качественно рисовать картинки по текстовому описанию. Dall-E 3 представили в конце сентября 2023 года, а публичный доступ к ней появился в начале октября.
Нейросеть доступна бесплатно через Bing Image Creator и по платной подписке в ChatGPT.
Bing AI Image Creator – отличная возможность познакомиться с миром нейросети DALL-E. Microsoft интегрировала эту передовую технологию в свой браузер Bing, предлагая пользователям простой и удобный редактор изображений на базе искусственного интеллекта. Главное достоинство – использование DALL-E 3, улучшенной и более совершенной версии платной нейросети.
Bing AI Image Creator выделяется на фоне конкурентов своей доступностью: это единственная полностью бесплатная нейросеть в нашем рейтинге. Достаточно просто войти в свою учётную запись Microsoft, и можно творить. Ежедневно доступно создание более 100 изображений, а ограничения по кредитам влияют только на скорость генерации, но не на количество. Важно отметить, что доступ к сервису возможен только через VPN.
Сначала я решила воспользоваться DALL-E через BotHub, для генерации изображения по промту:
Вообще, выглядит интересно, хотя и напрягают глаза на фоне, а также палатка на фоне, которая как бы внутри вольера с зайцами, но в то же время снаружи. Палитра также будто бы слишком на контрасте, с точки зрения композиции - много элементов, которые оттягивают внимание с трех зайцев на переднем плане.
Теперь сгенерируем через Bing:
Уже что-то более спокойное и приятное. Появилось освещение и даже неплохо обыгранное. Но не хватает некоторой небрежности в рисунке, которая создавала бы более мрачную и зловещую атмосферу. В целом, картинка довольно точно соответствует промту, есть лишь несоответствия в стиле, который можно трактовать двояко.
Leonardo AI — это не просто очередная бесплатная нейросеть для генерации картинок. Это настоящий инструмент для творчества с широчайшими возможностями. Помимо стандартной генерации по текстовому описанию или изображению-образцу, Leonardo AI позволяет обучать собственные модели и загружать их в редактор. Можно экспериментировать с настройками, подсказками, стилями — и результат сможет вас впечатлит. Кстати, после регистрации вас ждёт небольшой 5-шаговый гайд, который поможет освоиться на платформе.
Чем ещё интересен Leonardo AI? Например, режимом холста, где можно не только ретушировать и улучшать изображения, но и менять их стиль, а также "растягивать" картинки на больший размер. А ещё здесь можно генерировать текстуры для 3D-моделирования.
Каждый день платформа дарит пользователям 150 бесплатных кредитов — более чем достаточно, чтобы создавать интересные изображения. Правда, за некоторые "плюшки" придётся доплачивать (премиум-подписка от 10 долларов в месяц).
Из плюсов — Leonardo AI работает без VPN и предлагает огромное количество настроек, так что, при желании, можно добиться потрясающих результатов. Но это и минус: придётся потратить время на освоение всех тонкостей, да и большинство крутых фишек — платные.
Попробуем скормить свой запрос и оценить генерацию картинки:
Иллюстрация выглядит симпатично, однако совсем не в стиле Don't Sterve. Иллюстрация не передает готичную стилистику игры, картинка более мягкая и комфортная, нежели мрачная, а также выполнена в довольно ярких цветах, что не совсем характерно нашему запросу. Хотя, если не брать это во внимание, то изображение получилось интересным.
Kandinsky – это русскоязычная нейросеть от Сбера, создающая изображения и другой контент по текстовым описаниям. В отличие от Midjourney, известной своими мультяшными картинками, Kandinsky делает ставку на фотореализм.
В основе Kandinsky лежит принцип диффузии: сначала изображение «зашумляется», превращаясь в нечто похожее на серый экран телевизора, а затем нейросеть шаг за шагом восстанавливает его, добиваясь реалистичности.
Kandinsky — это не просто генератор картинок по текстовым описаниям. Эта нейросеть от Сбера умеет гораздо больше. Kandinsky способна создавать новые картины, органично смешивая элементы двух разных изображений, а также менять стиль уже существующих изображений, например, в духе любимого художника. Нужен фон для картины? Kandinsky дорисует. Также нейросеть позволяет переносить позы, предметы и другие элементы с одной картинки на другую. А еще Kandinsky умеет создавать короткие гифки, из которых можно собирать небольшие видеоролики.
Подадим наш запрос:
Арт получился довольно приятным, однако стиль рисовки получился сказочной, уютный и добрый, что далеко от нашего запроса: нет гротескности и мрачности. Наша осенняя цветовая палитра вышла просто теплой, а также мы потеряли морковь возле пруда. Если суммировать, то картинка не соответствует описанию в полной мере из-за различий в стиле и передаваемой атмосфере.
«Шедеврум» — это не просто сервис для генерации картинок на базе нейросети YandexART, а полноценная социальная сеть для любителей цифрового искусства. Здесь можно подписываться на понравившихся авторов, оценивать работы, оставлять комментарии и находить вдохновение в ленте рекомендаций.
Отличительной особенностью «Шедеврума» является высокое качество генерируемых изображений. Нейросеть YandexART использует метод каскадной диффузии: сначала создается базовая картинка, а затем, шаг за шагом, увеличивается её разрешение и прорабатываются детали. Доступно в веб-версии, на iOS и Android.
Посмотрим на нейросеть в действии:
Начнем со стиля: он больше мягкий и мультяшный, чем тот, что мы хотели. Если говорить об атмосфере, то она воспринимается больше сказочной, чем мрачной, а это, вероятно, из-за теплой палитры цветов. Стоит также сказать, что отсутвуют костры и морковь. Вообще, картинка содержит так называемую базу, вроде трех кроликов и пруда, но общий стиль и атмосфера разнятся с нашим запросом.
Starry AI – отличный вариант для тех, кто делает первые шаги в мире нейросетей и хочет попробовать себя в генерации изображений. Здесь всё предельно просто и понятно: удобный интерфейс, простой редактор — разберётся даже новичок. А если возникнут сложности с формулировкой запроса, Starry AI всегда подскажет, как его улучшить, чтобы получить именно то, что нужно.
Конечно, по мощности Starry AI уступает некоторым монстрам индустрии, но у неё есть своё очарование — огромная коллекция стилей (больше 1000!). Можно экспериментировать и пробовать, искать свой собственный почерк. Единственное, стоит иметь в виду, что качество картинок может варьироваться, да и с анатомией у персонажей иногда бывают проколы.
Каждый день Starry AI дарит пользователям 5 бесплатных кредитов. Есть премиум-подписка, которая позволит творить без границ (от 12 долларов). И ещё один плюс — Starry AI доступна не только на компьютере, но и на смартфоне (iOS и Android).
Теперь посмотрим на нейросеть в действии:
Сразу, с порога некоторые вопросы к анатомии и это не про уши. Тела кроликов вызывают некоторые вопросы, ну, и, конечно, уши. Хотя, мне нравится это перфоманс с тремя ушами, выглядит интересно, но это все-таки не кролики в обычном их понимании. Если пройтись в целом по промту, то можно заметить, что стилистика плоская и мультяшная; сами кролики стоят на земле, а не в воде; ограниченная цветовая палитра; нет костров и светящихся глаз; нет разбросанной моркови. Картинка не проходит по большинству пунктов и содержит лишь базовые элементы, но по своей сути отличается по стилю и деталям.
Как видите, у каждой из рассмотренных нейросетей есть свои сильные и слабые стороны. Некоторые из них лучше справляются с передачей стиля, другие — с детализацией, третьи — с работой со светом и тенью.
Вообще, решила не писать под каждой генерацией, однако в выводе стоит затронуть: все напрямую зависит от промта (молодец, вот это открытие сделала). Да, возможно я не получила невероятного результата просто по причине того, что мой промт изначально был некорректен и, если с ним поиграть, тогда вполне вероятно получится то, что я хотела изначально. У каждой из рассмотренных нейросетей есть свои "плюшки", с которыми можно научится работать, потратив на это какое-то время, чтобы далее генерация картинок не занимала много времени.
Выбор инструмента всегда остаётся за вами. Надеюсь, что этот обзор поможет вам сориентироваться в мире нейросетей и найти ту, которая откроет перед вами новые творческие горизонты.
Спасибо за внимание! Рады будем прочитать про ваш опыт в генерации изображений, может быть у вас уже есть свой любимый сервис для создания артов?