Сбер представил на AI Journey нейросети Kandinsky 5.0 для генерации фото и видео

Сбер на конференции AI Journey представил новое поколение генеративных моделей Kandinsky 5.0 для изображений и видео.

Линейка ориентирована на профессиональное творчество и персональные креативные задачи, уделяя особое внимание русскому культурному коду и качеству визуального результата. Доступ к ключевым функциям уже открыт в популярных сервисах компании.

  • Image Lite: генерация по тексту до 1280×768, редактирование через Image Editing, добавление надписей в стилистике сцены; в основе — диффузионный трансформер Kandinsky‑DiT Lite (6 млрд параметров) на архитектуре Cross Attention DiT.
  • Video Pro: видео до 10 секунд с частотой до 24 fps и разрешением до 1280×768; внутри — image‑to‑video и T2V Flash для «оживления» картинок, заявлены отличная динамика и управление ракурсом камеры; модель построена на Kandinsky‑DiT Pro (19 млрд параметров, Cross Attention DiT).
  • Качество: финальные датасеты курировались дизайнерами, арт-директорами и художниками с акцентом на композицию, стиль и визуальную чистоту.
  • Доступность: функции уже работают в мессенджерах Telegram и Max, на веб‑платформе GigaChat и в приложении GigaChat для Android.

Kandinsky 5.0 Image Lite умеет формировать сцены по текстовым описаниям, редактировать загруженные изображения и органично вписывать типографику в композицию. Отдельный фокус обучения сделан на корректной передаче стилистики, персонажей и культурных контекстов, релевантных русскоязычной аудитории.

Модель Kandinsky 5.0 Video Pro нацелена на быстрый продакшн коротких роликов: поддерживает плавную динамику, смену планов и виртуальную «камеру». Комбинация image‑to‑video и T2V Flash обеспечивает создание клипов как из текста, так и из статичного кадра, что упрощает сториборд‑подход и быстрые итерации.

По заявлению команды, на финальных стадиях разработки датасеты дополнялись материалами с «безупречной композицией, стилем и визуальным качеством», что должно повысить художественность выдачи без сложных промптов. Обе модели уже интегрированы в пользовательские каналы, а значит, доступны для тестирования широкой аудиторией.

Фото аватара

Сергей Шац

Специализация: ZeroCode, NoCode, LowCode
Современные подходы интеграции систем

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *