Würstchen V2 — быстрее чем SDXL. Наконец-то после...
Würstchen V2 — быстрее чем SDXL
Наконец-то после прогрева зарелизили "Колбаску V2". Модель генерит картинки в 1024x1024 быстрее чем SDXL и состоит из двух этапов диффузии.
Stage A: это text-conditioned диффузия на 1 млрд параметров. Ускорение тут достигается из-за ультра высокой компрессии вместо размера скрытого кода 128x128x4 как у SDXL, тут сначала работают в разрешении 24x24x16 — в 5 раз меньше пикселей, но больше каналов.
Далее идёт Stage B: это диффузионная модель на 600M параметров, которая разжимает из 24x24 в разрешение 128x128.
Ну а в конце по традиции декодер, (20M параметров) который рендерит картинку из скрытого кода.
По скорости выходит в 2-2.5 раза быстрее чем SDXL.
По качеству, думаю небольшой проигрыш есть - хочу ещё провести честное сравнение.
В автоматик1111, конечно же ещё не завезли.
Блог + демо
Код
Веса
Google Colab
@ai_newz
Наконец-то после прогрева зарелизили "Колбаску V2". Модель генерит картинки в 1024x1024 быстрее чем SDXL и состоит из двух этапов диффузии.
Stage A: это text-conditioned диффузия на 1 млрд параметров. Ускорение тут достигается из-за ультра высокой компрессии вместо размера скрытого кода 128x128x4 как у SDXL, тут сначала работают в разрешении 24x24x16 — в 5 раз меньше пикселей, но больше каналов.
Далее идёт Stage B: это диффузионная модель на 600M параметров, которая разжимает из 24x24 в разрешение 128x128.
Ну а в конце по традиции декодер, (20M параметров) который рендерит картинку из скрытого кода.
По скорости выходит в 2-2.5 раза быстрее чем SDXL.
По качеству, думаю небольшой проигрыш есть - хочу ещё провести честное сравнение.
В автоматик1111, конечно же ещё не завезли.
Блог + демо
Код
Веса
Google Colab
@ai_newz
Источник: эйай ньюз
2023-09-18 17:57:04