Сбер на конференции AI Journey представил новое поколение генеративных моделей Kandinsky 5.0 для изображений и видео.
Линейка ориентирована на профессиональное творчество и персональные креативные задачи, уделяя особое внимание русскому культурному коду и качеству визуального результата. Доступ к ключевым функциям уже открыт в популярных сервисах компании.

- Image Lite: генерация по тексту до 1280×768, редактирование через Image Editing, добавление надписей в стилистике сцены; в основе — диффузионный трансформер Kandinsky‑DiT Lite (6 млрд параметров) на архитектуре Cross Attention DiT.
- Video Pro: видео до 10 секунд с частотой до 24 fps и разрешением до 1280×768; внутри — image‑to‑video и T2V Flash для «оживления» картинок, заявлены отличная динамика и управление ракурсом камеры; модель построена на Kandinsky‑DiT Pro (19 млрд параметров, Cross Attention DiT).
- Качество: финальные датасеты курировались дизайнерами, арт-директорами и художниками с акцентом на композицию, стиль и визуальную чистоту.
- Доступность: функции уже работают в мессенджерах Telegram и Max, на веб‑платформе GigaChat и в приложении GigaChat для Android.
Kandinsky 5.0 Image Lite умеет формировать сцены по текстовым описаниям, редактировать загруженные изображения и органично вписывать типографику в композицию. Отдельный фокус обучения сделан на корректной передаче стилистики, персонажей и культурных контекстов, релевантных русскоязычной аудитории.
Модель Kandinsky 5.0 Video Pro нацелена на быстрый продакшн коротких роликов: поддерживает плавную динамику, смену планов и виртуальную «камеру». Комбинация image‑to‑video и T2V Flash обеспечивает создание клипов как из текста, так и из статичного кадра, что упрощает сториборд‑подход и быстрые итерации.
По заявлению команды, на финальных стадиях разработки датасеты дополнялись материалами с «безупречной композицией, стилем и визуальным качеством», что должно повысить художественность выдачи без сложных промптов. Обе модели уже интегрированы в пользовательские каналы, а значит, доступны для тестирования широкой аудиторией.