Alibaba Tongyi Lab оголосила про «Z-Image Turbo AI», який, ймовірно, стане великим поворотним моментом у технології генерації зображень. Головною особливістю цієї моделі є неймовірна швидкість — вона може створювати фотореалістичні зображення розміром 1024×1024 пікселів менш ніж за 1 секунду.
Впровадження інновацій у легкість та ефективність
Z-Image Turbo AI має 6 мільярдів параметрів і за допомогою технології Decoupled-DMD дистиляції зменшує кількість кроків обчислення до всього 8. Це оптимізація дозволила швидко обробляти зображення навіть на споживчому GPU з 16GB VRAM. У галузі генерації зображень, де раніше було необхідно значне збільшення VRAM, ця модель приносить революцію у ефективність використання VRAM і значно знижує бар’єри для звичайних користувачів.
Багатомовна підтримка та практичність
Ця модель, відкритий код якої доступний за ліцензією Apache 2.0, підтримує двомовну обробку підказок і високоточне відтворення тексту всередині зображень. Це значно розширює можливості її застосування на глобальному ринку. Проєкт спроектований так, щоб зменшити апаратні обмеження і підвищити точність підказок, що може зробити його новим стандартом для локалізованого впровадження AI.
Ці технологічні досягнення відкривають нові шляхи для оптимізації AI-обчислень і роботи моделей на периферійних пристроях.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
З'явився AI, який генерує зображення розміром 1024×1024 менш ніж за 1 секунду, значно покращено ефективність VRAM
Alibaba Tongyi Lab оголосила про «Z-Image Turbo AI», який, ймовірно, стане великим поворотним моментом у технології генерації зображень. Головною особливістю цієї моделі є неймовірна швидкість — вона може створювати фотореалістичні зображення розміром 1024×1024 пікселів менш ніж за 1 секунду.
Впровадження інновацій у легкість та ефективність
Z-Image Turbo AI має 6 мільярдів параметрів і за допомогою технології Decoupled-DMD дистиляції зменшує кількість кроків обчислення до всього 8. Це оптимізація дозволила швидко обробляти зображення навіть на споживчому GPU з 16GB VRAM. У галузі генерації зображень, де раніше було необхідно значне збільшення VRAM, ця модель приносить революцію у ефективність використання VRAM і значно знижує бар’єри для звичайних користувачів.
Багатомовна підтримка та практичність
Ця модель, відкритий код якої доступний за ліцензією Apache 2.0, підтримує двомовну обробку підказок і високоточне відтворення тексту всередині зображень. Це значно розширює можливості її застосування на глобальному ринку. Проєкт спроектований так, щоб зменшити апаратні обмеження і підвищити точність підказок, що може зробити його новим стандартом для локалізованого впровадження AI.
Ці технологічні досягнення відкривають нові шляхи для оптимізації AI-обчислень і роботи моделей на периферійних пристроях.