Нейролента - подборка новостей о нейронных сетях, ChatGPT

Ну, за дизайнеров

Ну, за дизайнеров.

Тут Тик-Ток выкатил работу под названием ГРАФИСТ.

Графист берет на вход некоторое количество графических элементов (просто картинки с альфой, RGBA), понимает, что они из себя представляют и делает макет. Расставляет элементы красиво с точки зрения графического дизайна.
То есть ИИ берет на себя композицию, по пути понимая, что за контент вы ему скормили.
На входе пачка RGBA файлов, на выходе JSON, описывающий слои и расположение элементов.

Из интересного: под капотом китайская LLM Qwen1.5-0.5B/7B, причем есть две версии Графиста: Graphist-Tiny на Qwen1.5-0.5B и
Graphist-Base на Qwen1.5-7B.

Читая статью узнал вот про такой датасет-сток:
https://create.vista.com/ - может кому-то пригодится.

На итоге они взяли волонтеров, которые в их веб-демо(которого нет) нагенерили картинок. Которые они прогнали через CPT-4 Eval и получили, предсказуемо, что Графист всех уделал.

Кода нет, демо нет, есть гитхаб с картинками и статья, любопытная притом.

https://github.com/graphic-design-ai/graphist