
Сохраняется 0 В закладки 0 В закладках 0
Команда Tongyi Lab (подразделение Alibaba) анонсировала Z-Image — ИИ-модель для генерации изображений размером 6 миллиардов параметров. Разработчики заявляют, что по качеству она не уступает крупным коммерческим нейросетям, но при этом остаётся открытой.
Модели уже доступны: их можно запускать на видеокартах с памятью меньше 16 ГБ, то есть фактически на домашнем компьютере. Подробности в материале Postium.


Нейросеть Z-Image — что это и как работает
В основе Z-Image лежит архитектура Single-Stream Diffusion Transformer (DiT). В отличие от классических подходов, где текст и визуальные данные обрабатываются раздельно, здесь процесс унифицирован.
Модель объединяет текстовые условия и «зашумленные» латенты (сжатые представления изображения) в единый поток данных. Это позволяет нейросети лучше понимать связь между словами в запросе и пикселями на картинке, повышая точность генерации при меньших вычислительных затратах.
Во внутреннем рейтинге Elo Z-Image показывает результаты, сопоставимые с закрытыми системами, и становится лидером среди открытых моделей.


Ключевое отличие Z-Image от большинства open-source решений — это наличие «интеллекта» и знаний о реальном мире. Модель оснащена модулем Prompt Enhancer, который выстраивает цепочку рассуждений перед рисованием. Нейросеть не просто ищет визуальные соответствия, а использует логику.


Кроме того, в модель заложены глубокие знания о мировой культуре и объектах. Она корректно генерирует известные достопримечательности, конкретных персонажей и реальные предметы, не искажая их детали, чем часто грешат другие открытые модели.


Линейка состоит из трёх моделей — каждая под свою задачу. Доступные версии:
- Z-Image-Turbo — для пользователей. Самая быстрая версия, которой достаточно 8 шагов вычислений, чтобы выдать готовый кадр. Работает на бытовых GPU и делает фотореалистичные изображения.
- Z-Image-Base — для разработчиков. Базовая «чистая» модель без ускорений. Предназначена для дообучения, кастомных стилей, экспериментов и построения собственных моделей на её основе.
- Z-Image-Edit — для дизайнеров. Версия для редактирования готовых изображений. Работает как ИИ-фотошоп: можно загрузить картинку и попросить изменить конкретный элемент, сохранив стиль и композицию.
Как пользоваться Z-Image бесплатно
Протестировать Z-Image проще всего прямо в браузере — на официальной странице в Hugging Face, где генерация работает без установки и настройки.


Для локального запуска достаточно скачать веса нужной версии и открыть их в любом стандартном инструменте, который поддерживает open-source модели: Diffusers, WebUI или ComfyUI.
Модель запускается так же, как обычные diffusion-модели, запускается на видеокартах до 16 ГБ и генерирует изображение по текстовому запросу без дополнительных параметров.
Почему это важно? Рынок генерации картинок за последние месяцы резко обновился. Flux вывел открытую ветку FLUX.1 и запустил Pro-версии, которые считаются эталоном фотореализма, но работают только в облаке. Google выпустил Nano Banana: базовая версия даёт бесплатную генерацию и простое редактирование, а Nano Banana Pro — продвинутый инструмент, но с привязкой к сервисам Gemini.
На этом фоне Z-Image — это ИИ-генератор, который одновременно открыт, компактен, работает локально и позволяет получить качество, близкое к флагманам.
Итог: Пользователи получили бесплатный аналог топовых нейросетей, который «думает» перед рисованием и запускается на обычном домашнем компьютере.
⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: .
Тэги Alibaba Нейросети