Kandinsky 2.1: генерация реалистичных изображений на русском языке
Kandinsky 2.1 — это мощный инструмент для генерации изображений на основе текстовых запросов на русском языке. Обученная на 170 миллионах связок «текст-изображение», нейросеть содержит 3,3 миллиарда параметров. Kandinsky 2.1 генерирует более реалистичные изображения, чем его конкуренты, и позволяет создавать картинки в разных стилях.
Как работает Kandinsky 2.1
Принцип работы нейросети заключается в генерации изображений на основе текстовых запросов. Kandinsky 2.1 имеет четыре режима работы:
- Генерация по тексту. Нейросеть создает изображение на основе текстового запроса.
- Смешивание изображений. Можно добавить две картинки и посмотреть на результат, полученный от нейросети.
- Вариации изображения. Если добавить уже готовую картинку или фото, можно получить новое изображение, задав определенную стилистику.
- Дорисовка. Нейросеть дорисовывает изображение.
Русский язык и Kandinsky 2.1
Kandinsky 2.1 поддерживает более 100 языков, в том числе и русский. Этот сервис может понимать русскоязычные запросы и учитывать их при генерации, что не может похвастаться конкурент Midjourney или Dall-e 2.
Где попробовать нейросеть Kandinsky 2.1
Вы можете попробовать нейросеть Kandinsky 2.1 одним из следующих способов:
- На тестовом сайте команды «Кандинского» — fusionbrain.ai. На этом сайте вы можете генерировать изображения на основе текстовых запросов и использовать режим дорисовки.
- В официальном телеграм-боте — http://kandinsky21_bot/. В этом боте доступны все четыре режима генерации.
- На сайте Rudalle — так называлась самая первая версия нейросети Сбера для генерации картинок.
- С помощью навыка «Включи художника» в голосовом помощнике «Салют» от Сбера.
Обратите внимание, что во всех четырех случаях нейросеть может не сработать. Регулярно появляются ошибки как на сайтах, так и в телеграм-боте. Сбер объясняет это большой нагрузкой на сервис.
Генерация картинок в Kandinsky 2.1
Область генерации обозначена фиолетовым квадратом. Ее размеры можно изменять, но это не особо полезно при стандартной генерации по тексту.
Сейчас доступно более 20 стилей, включая киберпанк, аниме, советские мультфильмы и хохлому. В англоязычных приложениях обычно проблематично сгенерировать подобные изображения, поскольку модели не обучены на таких картинках.
Полный список стилей:
- Аниме
- Детальное фото
- Киберпанк
- Кандинский
- Айвазовский
- Малевич
- Пикассо
- Гончарова
- Классицизм
- Ренессанс
- Картина маслом
- Рисунок карандашом
- Цифровая живопись
- Средневековый стиль
- Советский мультфильм
- 3D-рендер
- Мультфильм
- Студийное фото
- Портретное фото
- Мозаика
- Иконопись
- Хохлома
- Новый год
Однако, следует отметить, что область для будущей генерации картинки постоянно сдвигается и мешает, что не очень удобно.
Как выбрать между Kandinsky 2.1 и Midjourney
Midjourney — это другой сервис для генерации картинок на основе текстовых запросов. Обычно Midjourney используют для создания стилизованных изображений, например, в стиле Ван Гога или Пикассо. Kandinsky 2.1, в свою очередь, позволяет создавать более реалистичные изображения.
Если вы хотите создать стилизованное изображение, то лучше выбрать Midjourney. Если же вы хотите получить более реалистичное изображение, то лучше использовать Kandinsky 2.1.
Заключение
Kandinsky 2.1 — это мощный инструмент для генерации изображений на основе текстовых запросов на русском языке. Этот сервис позволяет создавать более реалистичные изображения, чем его конкуренты. Если вам нужен инструмент для создания реалистичных изображений, то Kandinsky 2.1 может быть отличным выбором.