Нейросети в тренде и закрепились там надолго. Но нужно понимать, что какие-то сервисы подходят максимум для баловства, а какие-то решают вполне серьёзные задачи: оживляют сцены, пишут тексты, находят основную суть в произведениях, отвечают за перевод и т.п.
Что касается email-рассылок, то здесь нейросети тоже могут быть весьма полезными. Например, им можно поручить создание медиаконтента, который как раз занимает массу времени и сил. Разработка одной только концепции, её согласование, поиск художника (исполнителя) могут занимать несколько дней или даже недель. А нейросеть может предложить варианты контента уже через несколько секунд. Естественно, переделывать результат ИИ может бесконечно и жаловаться на неадекватных заказчиков никому не будет.
Итак, какие нейросети в 2024 году можно использовать для генерации изображений?
Наш рейтинг:
- Встроенные нейросети RuSender (на основе DALL-E)
- Шедеврум (YandexART)
- Kandinsky (Fusion Brain)
- Stable Diffusion
- Gerwin
- Playground AI
Какие нейросети хотелось бы включить, но они были умышленно опущены по причине невозможности использования в РФ: DALL-E, Midjourney, Lexica, Copilot Designer (Bing Image Creator), Gemini (Google), Firefly (Adobe), Krea, Dreamstudio и т.п. Даже если решение бесплатное, то скорее всего будет блокироваться доступ на основе расположения IP-адреса. Соответственно, без танцев с бубнами у вас всё равно ничего не получится.
Теперь о каждой нейросети из рейтинга расскажем поподробнее.
Встроенные нейросети RuSender – просто и никуда не нужно ходить
Интерфейс на русском: есть.
Интересные особенности: выбор стиля, генерация по описанию, поиск изображений по фотостокам, несколько вариантов сразу.
Бесплатный тариф: решение включено в конструктор RuSender.
Платные тарифы: нет.
Сайт: rusender.ru
Опция Magic Image в конструкторе RuSender – это готовое интегрированное решение на базе популярной нейросети DALL-E от Open AI. Процесс генерации разбит на несколько простых шагов: достаточно ввести описание или ключевые слова (поддерживается в том числе русский язык), выбрать стиль и, вуаля, вы получаете 4 варианта изображения, сгенерированных ИИ.
Если картинки не понравились, можно поменять условия промта. И так до тех пор, пока результат вас не устроит.
Ключевые фишки
- Сервис генерации изображений встроен прямо в редактор писем. Нигде регистрироваться и что-то дополнительно оплачивать не нужно.
- Нейросеть понимает русский язык.
- Есть 10 готовых стилей на выбор (от реализма до векторной графики).
- Нет ограничений по количеству запросов или генерации (как у многих топовых нейросетей).
- В том же редакторе есть возможность поиска по большому числу бесплатных фотостоков.
- Никаких копирайтов и водяных знаков, изображения можно использовать по своему усмотрению.
Недостатки
- Чтобы генерировать изображения, нужно быть клиентом RuSender (хотя бы с бесплатной учётной записью, подробнее о тарифах).
- Встроенная нейросеть не умеет редактировать имеющиеся изображения, совмещать несколько фото в одно или дорисовывать что-то. Есть только генерация с нуля. Все доработки только вручную.
- Качество изображений получается не самым лучшим, особенно, если речь о реалистических картинках на свободную тему. Нужно понимать, что функционал рассчитан на возможность создания простой графики в теле электронных писем.
Стоимость использования
Использование блоков Magic Image в RuSender полностью бесплатное. Но это не значит, что вам не нужно оплачивать подписку сервиса рассылок:
- Free-тариф – не более 500 клиентов в базе (2000 писем в месяц).
- Premium – от 792 руб./месяц. Размер абонплаты будет зависеть от количества подписчиков в базе.
- uCombo – от 1112 руб./месяц. Включает в себя доступ ещё к 4 сервисам для бизнеса (uKit, WebAsk, uCalc, BoardCRM).
Шедеврум (YandexART) – бесплатная нейросеть для генерации абстрактных изображений
Интерфейс на русском: есть.
Интересные особенности: генерация видео, встроенная соцсеть, создание текстового контента.
Бесплатный тариф: всегда бесплатно.
Платные тарифы: нет.
Сайт: shedevrum.ai
Шедеврум – это продукт Яндекса, созданный скорее для тестирования возможностей собственной нейросети, чем для заработка. Каких-то особых навыков у этой нейросети нет, но картинки она генерирует отлично, например, здесь можно создать портреты бабы яги, лиха, ёшкиного кота и девочки-кошки. К слову, тот же движок, то есть YandexGPT, работает во многих других продуктах Яндекса: в браузере, в Яндекс.Станциях и в смарт-телевизорах, в паре с голосовым ассистентом Алисой и т.п.
Ключевые фишки
- Шедеврум неплохо справляется с задачами, в которых нужно «фантазировать».
- Отлично воссоздаются разные стили начертания, поддерживается высокое разрешение и реализм.
- Необязательно что-то создавать с нуля, можно поискать в базе сервиса. Наверняка найдётся готовый результат.
- Нейросеть знает портреты многих знаменитостей и может создавать контент с их участием.
- Поддерживается генерация коротких роликов (пока в стадии тестирования).
- Пользователь может управлять сгенерированным контентом (сохранять в облачном хранилище, делиться, удалять и т.п.).
- Шедевруму можно поручить написание небольших текстов и историй.
Недостатки
- Создавать новые картинки можно исключительно в мобильных приложениях. С десктопа разрешается только просматривать пользовательский контент.
- Правила сервиса запрещают использовать контент в коммерческих целях.
- Все картинки по умолчанию становятся общедоступными.
Стоимость использования
Сервис пока полностью бесплатный. Возможно, какая-то монетизация появится в будущем. Например, на базе Yandex GPT для коммерческих организаций.
Kandinsky (Fusion Brain) – бесплатная нейросеть от Сбера
Интерфейс на русском: есть.
Интересные особенности: генерация видео, смешивание картинок, дорисовка, смена стиля.
Бесплатный тариф: всегда бесплатно.
Платные тарифы: нет.
Сайт: fusionbrain.ai
Kandinsky – это продукт Сбера, который начал свою историю с открытой кодовой базы ruDALL-E. Сейчас нейросеть многому научилась и сильно усложнилась по сравнению с первоначальным продуктом. Она умеет создавать короткие ролики и переносить стиль на имеющиеся изображения, а также смешивать между собой разные картинки. Доступ к Kandinsky можно получить через приложения Сбера (с голосовым ассистентом Салют), а также через чат-бота Telegram и на официальном сайте проекта.
Ключевые фишки
- Генерируются очень реалистичные изображения, даже если тема явно мифическая или сказочная.
- Большое количество встроенных фильтров (стилей) и возможность создания своих.
- Негативные промты (то, что нужно исключить из генерации).
- Масса дополнительных инструментов для работы с изображениями: ластик, смешивание двух картинок, перенос стиля и т.п.).
- API для использования во внешних сервисах и программах.
- Генерация коротких видео и анимаций.
- Возможность дорисовывания частей к имеющимся изображениям (только в полноценном редакторе, через бота такое сделать не получится).
Недостатки
- Базовый холст – не более 1024*1024 пикселя, увеличить размер изображения можно только за счёт дорисовки.
- В боте качество генерации картинок отличается (причём непонятно почему).
- Нет мобильных приложений (только если обращаться через помощника Салют, но для этого нужно знать, как активировать специальный режим работы).
Стоимость использования
Для личного и некоммерческого использования пока всё полностью бесплатно. Скорее всего для юрлиц скоро будут предложены специальные подписки, но пока об этом мало информации.
Stable Diffusion – нейросеть, которую можно установить на свой ПК или сервер
Интерфейс на русском: из коробки нет.
Интересные особенности: возможность разворачивания на своём оборудовании, дообучение по своим базам, можно снять ограничения на тип контента.
Бесплатный тариф: бесплатно на своих устройствах.
Платные тарифы: по ценам партнёров/сторонних сервисов.
Сайт: stability.ai/stable-image
Stable Diffusion – это целое семейство нейросетей от команды Stability AI. В отличие от остальных игроков рынка, Stability предлагает использовать свои наработки в открытом доступе. Любой желающий может скачать код нейросети и развернуть её на своём «железе». Но тут важно понимать, что конфигурации ПК нужны с максимальной производительностью (в частности, требуются топовые модели графических видеоускорителей, только на них генерация будет работать сносно).
Те же разработчики предлагают и другие модели нейросетей – для работы с аудио, с переводами, видео и пр. Как раз на базе Stable Diffusion работают многие профильные web-сервисы. Они просто оборачивают нейросеть web-интерфейсом и дообучают её конкретным навыкам.
Ключевые фишки
- У нейросети много модификаций и форков, готовых дата-сетов для обучения, плагинов, расширений и т.п.
- Это настоящий конструктор «сделай сам». Параметры итогового решения будут зависеть только от ваших настроек и действий.
- К нейросети предлагается большое количество готовых интерфейсов.
- На базе Stable Diffusion работает огромное множество web-сервисов и чат-ботов. Нейросеть интегрируется с различным профессиональным софтом, в том числе встраивается в графические редакторы.
- Нейросеть умеет дорисовывать изображения, повышать их исходное разрешение, копировать стиль, менять отдельные объекты на картинке и т.п. Она также способна создавать полноценные арты на основе ваших набросков.
Недостатки
- Нейросеть очень сложно установить на своём оборудовании, если нет навыков работы с консолью. Плюс, требуются мощные и дорогостоящие видеокарты.
- Не менее сложно настраивается сама нейросеть. К ней ещё нужно добавить интерфейс (если не хотите работать в консоли). А если нужна кардинальная доработка, то модель придётся переобучать. А это долго и ресурсоёмко.
- Многие публичные модели на базе Stable Diffusion генерируют изображения не более чем 512*512 пикселей. Это мало, поэтому разрешение нужно повышать отдельно.
- Нейросеть нельзя просто взять и попробовать в действии. У каждого web-сервиса, который работает на её основе, могут быть свои особенности и условия тестирования. Хотя можно встретить даже полностью бесплатные сайты.
- Выбор нейросетей на базе Stable Diffusion просто зашкаливает. Один только процесс поиска наиболее подходящей может занять несколько дней.
- Для формирования адекватных промтов нужно знать все тонкие настройки и их параметры. А их очень много.
- Из коробки Stable Diffusion нормально работает только с промтами на английском языке.
- В ранних сборках нейросети было много багов, связанных с неправильной отрисовкой лиц, рук и пальцев.
Стоимость использования
Если не учитывать необходимость покупки топового «железа» для ПК, то Stable Diffusion можно использовать полностью бесплатно. Правда, правила разработчиков запрещают работу нейросети в коммерческих проектах – для этого нужно оплатить специальную подписку (от 20 $/месяц).
Если вы хотите использовать Stable Diffusion в виде готового web-сервиса, то тут свои нюансы. У каждого из таких сервисов могут быть свои ограничения бесплатного использования (если оно вообще есть) и свои варианты подписок.
Например:
- stablediffusion.com.ru – от 990 руб. за 1000 токенов
- clipdrop.co (официально рекомендуемый сервис от разработчиков Stable Diffusion) – от 40 $/год (из России оплатить не получится).
- Dezgo.com – бесплатно (но последних моделей нейросети в ассортименте нет).
- replicate.com/stability-ai/stable-diffusion – тоже бесплатно, форма ввода фактически отражает многие доступные настройки промтов.
- lexica.art – тут свой вариант натренированной нейросети Stable Diffusion, доступ только платный, от 8 $/месяц (тоже не оплатить из РФ).
Список можно продолжать бесконечно.
Gerwin – набор нейросетей в помощь владельцам сайтов и бизнеса
Интерфейс на русском: есть.
Интересные особенности: создание текстового контента, высокое разрешение (до 4K).
Бесплатный тариф: всегда бесплатно.
Платные тарифы: нет.
Сайт: gerwin.io/ru
Gerwin – это откровенно коммерческий сервис, который нацелен на интернет-маркетологов, SEO-шников, копирайтеров, владельцев сайтов и на другие категории клиентов, работающих в сети. В основе Gerwin связка из нескольких нейросетей (GPT-4, BELT и др.). Основное преимущество в том, что сервис можно оплатить в рублях и при этом получить адекватный результат.
Ключевые фишки
- Большой выбор форматов генерации изображений. Это касается как соотношения сторон, так и конечного разрешения (вплоть до 4000 пикселей).
- Обеспечивается достаточная фотореалистичность. А как раз такие картинки и нужны на сайтах или в электронных письмах.
- Изображения подходят для коммерческого использования. Никто не предъявит вам права на интеллектуальную собственность.
- Промты можно и нужно вводить на русском языке.
- Предоставляется большой ассортимент стилей.
- Есть формат оплаты «навсегда».
Недостатки
- Gerwin фактически представляет собой обёртку для API сторонних нейросетей. Своей нейронки под капотом у него нет.
- Оплата привязывается к пакетам символов и к количеству изображений. За масштабирование картинок нужно доплачивать отдельно.
- Основной функционал платформы выстроен вокруг текстов, изображения здесь скорее побочный продукт.
Стоимость использования
Бесплатное тестирование предоставляется только по запросу через менеджера в Telegram.
Пакеты генераций – от 280 до 150000 руб. Позволяют создавать от 40 до 60000 изображений.
Подписка Gerwin Pro – 1190 руб./месяц или 7900 руб. навсегда. В рамках подписки клиент получает каждый месяц по 50 тыс. кредитов (можно сгенерировать до 200 изображений).
Playground AI – графический редактор со встроенным ИИ
Интерфейс на русском: нет, но понимает промты на русском.
Интересные особенности: генерация видео, встроенная соцсеть, полный набор инструментов редактирования.
Бесплатный тариф: до 100 изображений в день.
Платные тарифы: от 12 $/мес.
Сайт: playground.com
Playground – это оригинальный web-сервис, который успешно сочетает в себе нейросеть, способную генерировать картинки в большом разрешении (до 1536 на 1536 пикселей), и графический редактор. Почти все объекты к стартовому изображению можно добавить простым описанием и перемещением окна фокуса.
Playground AI позволяет удалять объекты с фото, изменять их размер, добавлять новые элементы, заменять и т.п. В основе сервиса несколько вариантов натренированных сетей Stable Diffusion, а также дефолтная версия Stable Diffusion XL. Модели можно менять в процессе работы и генерации.
Ключевые фишки
- Промты можно вводить на русском языке.
- Предоставляется большой объём бесплатных генераций (около 100 изображений в день).
- Картинки допускается использовать в коммерческих целях.
- Имеется своя социальная сеть, в которой можно поделиться сгенерированным контентом. При этом контент может создаваться и храниться приватно (без публикации).
- Большое количество встроенных фильтров (стилей).
- Допускается обработка загруженных картинок. Из сторонних изображений можно копировать не только стили, но и позы или композиции.
- Впечатляющий встроенный редактор. Например, здесь легко и быстро можно заменить лицо, убрать фон, добавить объекты и пр. На основе картинки можно в пару кликов сгенерировать альтернативные варианты.
Недостатки
- Интерфейс на английском языке (на русский его никак не переключить).
- Pro-тариф не оплатить с российских карт, поэтому остаётся только использовать бесплатные опции.
- В бесплатном тарифе нужно долго ждать генерации и есть ряд других ограничений (количество картинок, разрешение холста, невозможно отключить автоматическую публикацию в общей ленте).
- Нет мобильных или десктопных приложений. Вся работа ведётся только через браузер (естественно, со смартфонов пользоваться неудобно).
Стоимость использования
Free-тариф позволяет создавать до 100 картинок в сутки, загрузить их можно без копирайта.
Pro-тариф – от 12 $/месяц, до 1000 генераций в сутки, загрузка картинок в высоком разрешении.
Turbo-тариф – от 36 $/месяц, до 2000 картинок в сутки, максимальная скорость генерации.
Выводы и рекомендации
Обзор российского сегмента показал, что действительно качественных решений, способных генерировать изображения, в российском сегменте не так уж и много. Часть оригинальных нейросетей ещё в разработке, но и рассчитаны они будут совсем на другие задачи. Дело в том, что создание картинок и коротких видеороликов требует немалых вычислительных ресурсов. Позволить себе содержание таких нейронок могут далеко не все. Поэтому в популярных web-сервисах либо используется API имеющихся крупных сервисов (ChatGPT, Midjourney и т.п.), либо модели нейросетей из открытого доступа, такие как Stable Diffusion.
Получить доступ к качественным зарубежным решениям из России становится всё сложнее и сложнее. Поэтому остаётся пользоваться тем, что есть.
Справедливости ради стоит отметить, что качество генерации медиаконтента отечественных решений тоже не стоит на месте. С каждой итерацией они становятся всё лучше и лучше.
Сервис email-рассылок RuSender предлагает готовую интеграцию ИИ, способную облегчить многие рутинные задачи по работе с контентом, в том числе генерацию изображений по текстовому описанию.
Дата публикации: 25 марта 2024