Alibaba представила открытый генератор изображений Z-Image — конкурент Nano Banana с упором на реалистичную графику и офлайн‑запуск.
Линейка включает три модели (Turbo, Base и Edit), но пока доступна только Z-Image-Turbo, которую можно протестировать и скачать на платформе Hugging Face. Модель поддерживает рассуждение над запросом, умеет добавлять текст на изображениях сразу на двух языках и в рейтинге AI Arena занимает четвертое место, уступая Seedream 4, Nano Banana и Nano Banana Pro. Для локального запуска требуется видеокарта как минимум на 16 ГБ, в Qwen модель недоступна.
- Открытый исходный код и локальная установка без интернета
- Три варианта: Turbo (доступна), Base и Edit
- Поддержка двуязычных надписей (английский и китайский)
- Рассуждение над запросом для более точной генерации
- 4-е место в AI Arena
- Доступна к тестированию на Hugging Face, загрузка модели возможна
Z-Image — новый генератор изображений от Alibaba, ориентированный на качество и воспроизводимость без обязательного подключения к сети. Открытый подход позволяет разработчикам и дизайнерам интегрировать модель в локальные пайплайны и корпоративные среды, где важны приватность и предсказуемые затраты.
Компания заявляет о трех конфигурациях:
- Z-Image-Turbo — ускоренная версия для быстрого получения результата. Поддерживает добавление текста на английском и китайском прямо на изображениях и использует рассуждение над промптом, чтобы корректнее интерпретировать запрос и детали сцены.
- Z-Image-Base — базовая модель, раскрывающая все возможности по качеству и детализации (ориентирована на лучшую фотореалистичность).
- Z-Image-Edit — вариант для редактирования: замена и добавление объектов, локальные правки, ретушь.
На данный момент в открытом доступе — Z-Image-Turbo. По данным сообщества бенчмаркинга, в рейтинге AI Arena она занимает 4-е место, уступая лидерам Seedream 4, Nano Banana и Nano Banana Pro. Это ставит модель в топ‑сегмент среди публично доступных генераторов.
Запустить Z-Image-Turbo можно локально: достаточно установить зависимости и подготовить GPU на 16 ГБ видеопамяти. Такой порог позволяет работать без облака и интернета, что удобно для офлайн‑сценариев, внутриконторного использования и задач, где критична защита данных. При этом в экосистеме Qwen модель сейчас недоступна.
Для быстрой пробы предусмотрен демо‑интерфейс на Hugging Face, там же доступна загрузка весов. После локальной установки пользователи получают стабильное время отклика, отсутствие сетевых ограничений и контроль над версиями модели и генерации.