DiffBIR: Towards Blind Image Restoration with Generative Diffusion...
DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior
Тут китайцы (тоже они, да) подвезли СОТУ по ресторации изображений и апскейлу.
Stable Diffusion знает как создавать реалистичные изображения. Осталось только как-то дообучить ее принимать low-qulity изображение как условие. В этом и суть работы.
Авторы берут и тренируют модуль, похожий на ControlNet, который принимаетна вход latent code испорченного изображения. Кроме того на вход этому контролнету еще дополнительно конкатенируют код
Еще до диффузии испорченную картинку прогоняют через более простой метод ресторации SwinIR (Stage 1), который убирает шум и артифакты, но не умеет генерить high-freq детали. Это позволяет диффузи концентрироваться в основном на мелких деталях, которые и придают реализм.
Работает, конечно медленнее чем ESRGAN, но лучше.
Сайт проекта
Колаб
Код демки
@ai_newz
Тут китайцы (тоже они, да) подвезли СОТУ по ресторации изображений и апскейлу.
Stable Diffusion знает как создавать реалистичные изображения. Осталось только как-то дообучить ее принимать low-qulity изображение как условие. В этом и суть работы.
Авторы берут и тренируют модуль, похожий на ControlNet, который принимаетна вход latent code испорченного изображения. Кроме того на вход этому контролнету еще дополнительно конкатенируют код
z_t
(z_T - это шум), я думаю это для того, чтобы условный сигнал адаптировался под текущий уровень шума, а не всегда был одинаковым. Еще до диффузии испорченную картинку прогоняют через более простой метод ресторации SwinIR (Stage 1), который убирает шум и артифакты, но не умеет генерить high-freq детали. Это позволяет диффузи концентрироваться в основном на мелких деталях, которые и придают реализм.
Работает, конечно медленнее чем ESRGAN, но лучше.
Сайт проекта
Колаб
Код демки
@ai_newz
Источник: эйай ньюз
2023-09-24 05:15:04