А вот в Bard завезли Imagen 2

А вот в Bard завезли Imagen 2.
В интернетике полная неразбериха, журналисты пишут про ImageFX в Барде:
https://www.theverge.com/2024/2/1/24057438/bard-gemini-imagen-google-ai-image-generation

Это совершенно разные модели. И да, в Барде именно Imagen 2.

Он забавный, я с ним поговорил немного.
Это уже конкурент DALL·E 3 из chatGPT, который впрочем сильно в роли догоняющего.

Он уже понимает в смыслы типа "крипто-зима".
Жестко цензурирован, не умеет в людей, даже close up of a lady приводит его в ужас.
Но.
Если заставить его самого предложить что-то взамен, то он начинает генерить моделей на пляже, с какими-то ластами вместо рук и ацкими пальцами.
Персонажей типа Марио генерить отказывается.
Бард все знает про Apple Vision Pro, но на просьбу сделать картинку, несет полную дичь.
Системный промпт не отдает, но говорит, что можно задавать разрешения и аспекты картинки прямо в промпте.
Терминатора генерить отказывается со странной формулировкой - я всего лишь языковая модель
Часто сваливается в отказ типа "I'm a text-based AI, and that is outside of my capabilities.", хотя я прошу явно сгенерить картинку. Особенно если промпт длинный.
Иногда его прямо клинит - я дал ему точный промпт с Лексики и сказал сгенери картинку вот по такому промпту - видно что Бард сначала полез в интернет, нашел этот промпт на Krea.ai(!), начал нести странную дичь, вместо генерации и давать ссылки на креа и выдавать вариации промпта через ||
Вот промпт

Либо я еще не привык к общению, либо у Барда разрывает мозги из-за того, что он пытается и в интернете поискать, и промпт проанализировать и расширить и картинку с генерить.

В общем у меня ощущение, что я пообщался с недообученным chatGPT и DALL·E 3, который иногда выдает приличный результат, но в основном неуправляем и непредсказуем именно из-за того, что пытается и в интернетик ходить и картинки генерить.

Пишите, что у вас.

https://bard.google.com/

Источник: Метаверсище и ИИще

2024-02-02 17:25:48