Нейролента - подборка новостей о нейронных сетях, ChatGPT

🎥Video Editing via Factorized Diffusion Distillation

Коллеги из Meta AI выпустили новый метод для редактирования видео. Все это поверх нашей модели Emu. Если вкратце, то архитектура представляет собой комбинацию Emu Edit и Emu Video (Temporal слои) поверх базовой модели Emu.

Тренируют модель с помощью двойной дистилляции с дискриминаторами. Студент состоит из комбинайии Emu Edit + Emu Video , то есть умеет и генерировать видео и менять изображения покадрово. А учителя два: 1) Это предобученный Emu Edit, который меняет каждый кадр по инструкции, 2) предобученный Emu Video, который тупо генерит видео по заданному промпту.

Таким образом, студент выучивает консистентно менять кадры на видео.

ArXiv
Сайт проекта с примерами

@ai_newz