Метаверсище и ИИще страница 11. Показано 7 статей из 557
2023-12-04 13:35:25
Ну и вот вам прототип будущего Метаверсика.
Когда у каждого может быть свой двойник этого утлого мира (точнее сколько угодно скинов для него).
Чувак стримит Google Eath в krea.ai - получает почти реалтайм, для виарчика уже сгодится.
"I'm streaming googleearth
into krea using an LCM-Lora model to turn the most ubiqituous digital twin of the world into a beautiful canvas. "
https://twitter.com/bilawalsidhu/status/1727461198604431370
Ждем ответочки от Гугла.
2023-12-04 13:20:06
Слушайте, мне одному все эти рейлтаймовые рисовалки с помощью Stable Diffusion напоминают GauGAN и первые демки Nvidia основанные на Ганах?
Я вот смотрю на Picass от Freepik и понимаю, что видел это 5 лет назад на стенде Нвидия в Ванкувере.
Интересно, что теперь это уже можно крутить на своем железе (4090 в помощь), а оптимизация Stable Diffusion за последние два месяца просто сорвалась с цепи, хотя Мостак обещал нам это больше года назад.
Ну и я думаю, что следующий апдейт от Адобченко убьет больше половины этих ловких стартапов, которые отчаянно пытаются сократить Time To Market, чтобы успеть собрать лидов и продать их инвесторам.
И да, выглядит круто. Мне еще больше "нравится" идея (тут кавычки отражают противоречивость) что вам сразу предлагают рисовать корабликами, машинками, цветочками. В общем собирать картинки из картинок.
https://www.freepik.com/pikaso
2023-12-04 13:01:28
А вот интересная работа по генерации лиц в 3Д.
Я уже подвел некий промежуточный итог по поводу генерации 3D нейронками, читайте по тэгу #3dgen
Мой диагноз такой: мало датасетов для генерации 3Д с хорошей топологией (шутка ли, что для датасетов парсят гитхаб по расширению .obj, где половина файлов - объектники из С-компиляторов). Для плохой топологии уже полно облаков точек, на которых можно учить нейросетки - на выходе будут статичные 3Д-истуканчики, годные для облетов в интернет магазинах и виарчике с плохими текстурами.
Также я топлю за то, что генерация в 3Д будет параллельно развиваться в узких классах, главный из которых - головы.
В этой работе уже есть UV-развертки и гордые заявления "Our synthesized faces can be semlessly integrated to existing CG pipeline, enables animation or relighting."
Но судя по тому, что они используют SDS - сетки там плохие, но передающие большее количество деталей. Приведенные примеры с анимацией и полное отсутствие информации о топологии лишь усиливают эту гипотезу.
Осталось взять их результат и спроектировать на 3Д-модель с нормальной топологией. Не руками.
Для гиков: By incorporating texture-less rendering in conjunction with SDS, we induce the T2I model to provide geometric-related priors, inciting details (e.g.,
wrinkles, lip shape) in the generated geometry. Building upon the generated geometry, we leverage ControlNet to force the SDS to be aware of the geometry, ensuring precise geometry-texture alignment. Additionally, we fine-tune a texture diffusion model that incorporates both RGB and YUV color spaces to compute SDS in the texture domain, enhancing the quality of the generated textures.
https://arxiv.org/pdf/2312.00375.pdf
https://faceg2e.github.io/
#3dgen
2023-11-14 11:10:57
А теперь, внимание, челлендж.
Вам надо нарисовать с помощью chatGPT и DALL·E 3 цветик-семицветик.
Условия: Не в Бинге. в chatGPT. Промпт должен быть на английском. Выяснилось, что chatGPT прекрасно знает сказку про семицветик.
Цветок с семью лепестками. Ровно.
Все мои попытки провалились. Рисует либо 6, либо 8.
После генерации даже считает лепестки неправильно, если ему дать на вход его же картинку и попросить посчитать(к вопросу о когнитивных заблуждениях). Правильно считает только в новом чате (необусловленном собственным творчеством).
Я сделал в фотошопе семицветик, дал ему, считает лепестки правильно, воспроизводит неправильно.
Мы с Лешей К. убили вечер, но не смогли родить каменный семицветик. Леша умудрился сделать пятицветик (подвиг, я считаю).
В общем для вас это повод залипнуть в DALL·E 3.
Присылайте в коменты свои варианты и диалоги с chatGPT - он вас удивит.
P.S. В природе семицветиков почти нет. Есть очень редкий вид - седмичник. Либо DALL·E 3 просто не досталось изображений с седмичником, либо он жестко завязан на осевую и центральную симметрию. Пишите теории заговора в чат.
Никаких миджорней и Stable Diffusion с контронетами. Взламываем мозги DALL·E 3
Большое спасибо подписчику Николаю за идею и наводку.
2023-10-30 15:07:32
Ну и после прочтения материала про указ Байдена по регулированию ИИ у меня нехорошее чувство.
Вынесу из коментов вот такую логичную реакцию:
"хотите использовать llm в бизнесе? а где ваша лицензия на использование больших языковых моделей? а ваш тюн сертифицирован? Ой, ну вот незадача, ваша исследовательская команда получает штраф десять палок по пяткам. Пока на замену можем вам предложить опенаи апи. О, за защиту данных не беспокойтесь, все защищено государством."
И действительно, похоже на то, что нас ждет нашествие адвокатов, нотариусов и контор, которые "за умеренную цену" сделают вам разрешение н
Дальше придут аудиторы, чтобы проверять кошерность ваших LLM и скрепность генераторов картинок - соответствуют ли ваши опенсорсные модели и файнтюны очередного Фалькона линии партии.
Внедряете ИИ? Покажите ваши сертификаты, разрешения, лицензии, справки из ИИ-диспансера.
Хотите заработать денег - уже сейчас переобувайтесь в юридические ИИ-консультации.
ИИ уже в курсе, судя по картинкам.
2023-10-08 16:33:06
Шутка про парацетамол перестает быть смешной.
GPT-4V поглядел вот на этот ад из правил парковки и дал правильный ответ. По картинке.
Кожаные, для которых пишутся такие правила, так не могут.
Пора менять кожаных.
2023-06-06 11:01:24
Интересный проект. Stable Diffusion + Control Net для создания QR кодов невиданной красоты.
Подробности, как вы понимаете, по ссылке из куар-кода.
Источник тут
https://twitter.com/ben_ferns/status/1665907480600391682