Недавно писал про бенчмарки для изображений

Недавно писал про бенчмарки для изображений. Не поленился, посмотрел в интернетике, как оценивают картинки на разных ресурсах. Причем не в бумагах или пресс-релизах к новой модели, где черипикнутые картинки уделывают конкурентов, а просто на технических сайтах.

Нашел вот такое описание метрик.

Соблюдение семантической нагрузки: Насколько точно созданное изображение отражает основную концепцию или сообщение, переданное в подсказке?
Композиционная гармония: Является ли изображение сбалансированным и эстетически приятным расположением элементов?
Художественный подтекст: Вызывает ли изображение какие-либо более глубокие эмоции, идеи или символизм, выходящие за рамки буквальной интерпретации подсказки?
Верность передачи техники: Если в задании требовались определенные художественные стили, насколько эффективно модель передала суть этой техники?

Вот один из примеров такого хит-парада.

Из интересного пишут такое:
В ходе эксперимента особое внимание было уделено сервисам, построенным на основе проприетарных моделей, что позволило выявить удивительно ограниченный ландшафт, в котором доминируют США, Россия, Индия и Китай - иллюстрация необходимых огромных технологических и финансовых ресурсов для разработки таких проектов.
Также из интересного: Кандинский занял пятое место, а ЯндексАРТ - десятое.
Про китайцев из Tongyi Wanxiang уже писал.
А вот про индийский Kalaido я ничего не слышал, пойду погляжу, что это.
И похоже что Turbo вписали по ошибке..

Какая картинка из какого генератора можете поглядеть по ссылке:
https://techbullion.com/a-showdown-of-creativity-a-comparative-analysis-of-proprietary-generative-ai-image-models/

А мне по прежнему интересно, как можно так измерять неизмеримое?

Или измеримое?

Источник: Метаверсище и ИИще

2024-04-16 18:32:09