эйай ньюз - страница 11

2023-01-22 17:32:25

Нейродайджест за неделю (#4)

🖼 Google Research представил свою Text-to-Image модель Muse
Модель обучается по текстовому эмбеддингу из предобученной LM предсказываиб маскированные токены изображения. Главная фишка Muse - это скорость генерации изображений: Muse на порядок обходит Imagen и LDM.

🧔3D Avatar Diffusion
Майкрософт выпустил диффузионную модель, которая способна построить 3D аватар по одной фотографии человека.

🙈 Нейросеть от Tencent Different Dimension Me превращает фото в аниме
[Немного треша в посте]

🎱 Очередная Yolo, уже V8
Авторы из Ultralytics проведут онлайн-семинар, посвященный новой версии, 24 января на YouTube

🕵️‍♀️ Художники подали в суд на Stability AI и Midjourney за нелицензированное использовагие их работ
[Прыгнуть на пост]

👨‍🎨 InstructPix2Pix: Редактор изображений с помощью текста от исследователей из Беркли на базе диффузионных моделей (с кодом и демкой) [Подробнее]

☠️ Лэйофы в индустрии: Google увольняет 12 тысяч сотрудников, а Microsoft — 10 тысяч.

❱❱ Читать нейродайджест #3

@ai_newz

2023-01-21 19:12:33

Ещё хочу добавить. В такие кризисные времена, если вы наемный работник в компании, то очень важно, чтобы вы работали на проектах, которые являются высокоприоритетными и стратегическими для компании. Ведь в первую очередь в расход пойдут те, кто работают над низкоприоритетными задачами.

2023-01-21 18:51:04

К слову про увольнения. Вот иконографика количества уволенных из tech индустрии в 2022. А в этом году по данным https://layoffs.fyi в tech секторе в среднем увольняют по 2600 человек в день.

Выглядит не утешительно, тут невольно начинаешь опасаться за свою задницу. Чтобы обезопасить себя нужно непрерывно развиваться и изучать новые технологии (я, конечно, говорю про AI инструменты тут). Прошло то время, когда ты мог 30 лет работать по профессии, которую получил в университете.

@ai_newz

2023-01-21 18:32:24

Бытует мнение, с которым я абсолютно согласен. Если Гугл не напряжется и не начнёт резко шипить (отгружать) в прод новые AI модели и развивать новые продукты на базе них, то компания канет в лету. В гугле очень много толковых ML инженеров и ресерчеров, но большинство из них начинают отгружать модели в прод, только когда они уходят работать в другие фирмы размером поменьше.

@ai_newz

2023-01-20 11:28:45

Google увольняет 12000 сотрудников. Сундар Пичай сегодня опубликовал открытое письмо всем гуглерам об этом нелёгком решении.

Но обещают инновации в сфере AI:
"I am confident about the huge opportunity in front of us thanks to the strength of our mission, the value of our products and services, and our early investments in AI."

Увольнения уже прокатились по всем крупным tech компаниям, не обошли и Гугл. Два дня назад, например, Microsoft анонсировал уже вторую волну увольнений на 10000 сотрудников.

@ai_newz

2023-01-19 12:03:28

Large Transformer Model Inference Optimization

Любителям погонять GPT-3 у себя на ноутбуке. Lilian Weng недавно написала объемный блог пост, про существующие техники ускорения и увеличения эффективности инференса больших языковых моделей, да и не только языковых, а больших трансформеров в целом.

Го читать статью!

А вот тут я ещё писал про ее топовый пост о диффузионках.

@ai_newz

2023-01-18 06:38:00

Это уже не смешно. Реально будет бублик что ли?

@ai_newz

2023-01-17 14:56:46

Твое 3D лицо, когда прогнал фото через 3D Avatar Diffusion 🌚

Правда, повторить дома не сможешь, потому что Microsoft никогда не публикует код от таких штук 👌.

@ai_newz

2023-01-17 13:28:04

Пайплайн 3D Avatar
Diffusion и примеры генерации 3D аватаров.

@ai_newz

2023-01-17 13:26:15

3D Avatar Diffusion

Майкрософт выпустил диффузионную модель, которая способна построить 3D аватар по одной фотографии человека. Да, он не супер реалистичный получается, но выглядит опрятно.

На вход одно фото (!), то что слева, и текстовое описание. А на выходе модель дает tri-plane репрезентацию 3D объема головы человека, которая декодидируется в radience field (типа как в NeRF) и рендерится. Архитектура очень занятная, и позовляет еще и редактировать как аватар будет выглядеть с помощью изменения текстового промпта, подаваемого на вход. За всеми деталями отправляю вас в статью.

❱❱ Сайт проекта
❱❱ Arxiv: Rodin: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion

@ai_newz

2023-01-16 14:00:20

Different Dimension Me (часть 2).

А вот и самый треш 😅 Поэтому и забанили сетку на западе.

@ai_newz

2023-01-16 14:00:15

Я как-то упустил перл от Tencent — нейронка Different Dimension Me, которая довольно забавно превращает фото в аниме.

Прилагаю результаты вам на обозерние.

После скандалов из-за неполиткорректности сетки (см. пост ниже), доступ к ней с западных IP закрыли. Но затем это обошли через VPN, и потыкать все еще можно тут.

@ai_newz

2023-01-16 10:45:01

Артисты подали в суд на Stability AI и Midjourney за нелицензированное использовагие их работ для обучении сетей. Это первый прецедент такого рода и очень интересно, чем это кончится, ведь это очень сильно может повлиять на развитие генеративных сетей и SD в частности.

Надеюсь, прогресс победит ретроградов и использование публичных датасетов в некоммерческих моделях все же не запретят.

Забавно, что на OpenAI DALL-E в суд не подали. Видимо, сказать про них особо нечего, там прозорливо молчали про используемый датасет и код никому не показывали.

Бомбежка в реддите: “you stand accused of illegal math on your computer”.

@ai_newz

2023-01-15 13:44:56

Нейродайджест за неделю (#3)

🐞 Код, написанный при помощи AI-ассистентов, содержит больше ошибок и уязвимостей
Хорошие новости для разработчиков! Исследователи из Стенфорда сравнили код, который программисты писали самостоятельно, и код, написанный при помощи Codex. В результате исследования оказалось, что баги и уязвимости вероятнее окажутся в коде, написанном при помощи AI-ассистента. При этом разработчики, использовавшие AI-ассистент, считали свой код более безопасным.

👩‍🔬 ChatGPT - соавтор научных работ
Еще в декабре вышла первая научная работа, прошедшая рецензию, в которой среди авторов указан ChatGPT. Паралелльно с этим, организаторы ICML запрещают использование AI-сгенерированного текста (за исключением, конечно, примеров работы модели) в статьях. Видимо, все потому что ...

🧐 Абстракты статей, написанные ChatGPT, с легкостью вводят ученых в заблуждение
Абстракты, написанные AI, для фейковых статей выглядят очень убедительно, а антиплагиат считает текст на 100% оригинальным.

🤑 Microsoft ведет переговоры об инвестировании уже 10 миллиардов долларов в OpenAI
При этом доля Microsoft составит 49%, а так же 75% дохода до покрытия инвестиций. Также планируется внедрить модели от OpenAI в продукты Microsoft Office. [Прыгнуть на пост]

🔎 Поисковик по Arxiv'y нового поколения
Поисковая система использует эмбеддинги абстрактов, полученные из текстовых моделей OpenAI, и позволяет искать по любым фразам. [Прыгнуть на пост]

💎 DeepMind представил DreamerV3
DreamerV3 — это универсальная модель, которая способна обучаться под различные задачи "из коробки" (и даже способна обходить узкоспециализированные алгоритмы). Кроме того, DreamerV3 это первый алгоритм, который может с нуля научиться собирать алмазы в майнкрафте.

❱❱ Читать нейродайджест #2

@ai_newz

2023-01-15 09:56:00

Так нейросеть видит или не видит? Что скажете?

Кажется, что-то видит 🧐

@ai_newz

2023-01-14 17:16:12

У этой нейронки можно спросить про любого человека, либо вообще про все что угодно. Я считаю, очень забавно посмотреть, что интернет знает про тебя и твоих друзей, поэтому cпросил "Крут ли Юрген Шмудхубер?" (кто не знает Шмидхебера, я про него писал тут).

За интерфейсом крутится сетка от компании kagi.com, которая пытается создать более удобную альтернативу google поиску. Стоит их поиск $10 в месяц, поэтому я пока на утенке duckduckgo.com.

Ну, а доступ к своей Large Languаge Model пока предоставляют бесплатно. Сетка рабтает по типу WebGPT, то есть она умеет отвечать на вопросы, и в тоже время умеет искать актуальную инфу в интернете и использовать ее в своих ответах.

Вперед играться! https://labs.kagi.com/ai/contextai

@ai_newz

2023-01-14 15:59:10

Shutterstock расширяет давние отношения с Meta

Прошла новость, что Shutterstock партнерится с Meta по теме датасетов с картинками: "By tapping into Shutterstock's collection of millions of images, videos and music, Meta plans to use these datasets to develop, train and evaluate its machine learning capabilities."

@ai_newz

2023-01-13 14:24:16

Не мог не поделиться такой красотой❤️. Анимация на основе Stable Diffusion.

И вы можете такое создать сами в Гугл Коллабе.

❱❱ Ссылка на Коллаб

@ai_newz

2023-01-12 19:56:46

Как я читаю Arxiv, и как справляюсь с количеством статей

Я вернулся в Цюрих, а значит пора искать новые статьи!

Читать голый arxiv.org в поисках новых статей за неделю подвластно лишь, наверное, полубогам. Каждый день ребята из Поднебесной заливают десятки, а то и сотни статей на архив. И, конечно, 99% из них – шлак или на абсолютно не релевантные темы. Хотелось бы иметь возможность искать статьи похожие по тематике и в идеале сортировать их по качеству, что довольно нетривиально сделать.

Раньше я использовал Arxiv-sanity от Карпатого для поиска похожих статей. Механика там довольно примитивная. Для каждой статьи обучается Exemplar-SVM на tf-idf фичах из абстракта, а затем статьи ранжируются по похожести. Текстовый поиск только по ключевым словам. Соответственно и качество поиска выходит не очень.

Раньше там ещё был счётчик количества упоминаний статьи в Твиттер, что говорило об уровне хайпа вокруг работы, но в новой версии его больше нет.

Сейчас кто-то наконец сделал толковый поиск по статьям на Arxiv, который удостоен технологиями 2023 года — https://arxivxplorer.com. В разделе CS – около 500к статей, и для каждой статьи посчитали текстовые эмбеддинги по абстракту, используя API к текстовым моделькам от OpenAI, о которых я писал тут. Это обошлось автору в $50. Зато теперь в строку поиска можно ввести любые фразы либо даже вопросы, по которым будет считаться эмбеддинг и выдаваться наиболее релевантные статьи из базы. Я очень рад таким инновациям и уже пересел на этот сервис!

@ai_newz

2023-01-10 23:29:16

А вот и фото со встречи в Тбилиси. Было много вина и интересных разговоров про карьеру, эмиграцию, конференции, как хайпануть в тиктоке 😂, да и просто про жизнь.

Друзья, спасибо что пришли, было очень кайфово!

2023-01-09 15:57:43

Microsoft планирует внедрить языковые модели, разработанные в OpenAI (GPT-3-like и прочие) в Ofiice365. Хотят, чтобы языковые модели помогали юзерам писать и улучшать текст прямо в Word, Outlook, Power Point и других приложения офиса.

@ai_newz

2023-01-09 07:57:23

Pun intended ✋

@ai_newz

2023-01-08 18:17:20

Для нашей встречи я забронировал стол [где напишу в лс] на вторник (10 января) в 18:00. Места там не много, бронь только на 10 человек, так что подтвердите в комментах, что точно придёте и лучше не опаздывайте 😊.

UPD. Ребят, в Тбилиси оказалось очень активное комьюнити! Следующий раз нужно делать митап в хакспейсе со слайдами:) а в этот раз, хотел бы просто пообщаться, поэтому не могу пригласить слишком много людей.

2023-01-08 13:51:54

Друзья, я сейчас в Тбилиси!

Было бы здорово собраться, пообсуждать эйай (и не только), попивая грузинское. Как вы на это смотрите? Жду вас в комментариях.

Я тут до четверга.

UPD. Предлагаю встретиться во вторник.

@ai_newz

2023-01-08 12:20:37

Нейродайджест за неделю

🚨 Атака на PyTorch
Злоумышленники подменили бинарник torchtriton в PyPI, из за чего PyTorch-nightly установленный через pip в период с 25 по 30 декабря содержал вредоносный код. [Подробнее на официальном сайте]

🎹 Творческий вайб от AI-сгенерированного репа в канале [Прыгнуть на пост с AI-Drake]

🧠 GPT позволяет диагностировать деменцию на ранней стадии
Для этого нейросети необходим фрагмент текста обычной речи пациента, вместо традиционных медицинских обследований.

📉 Продажи видеокарт для ПК упали до 20 летнего минимума
После бурного роста продаж по время пандемии, в 3 квартале 22 года продажи упали на 42% до уровня 2005 года.

🔎 Помните предыдущий пост про панику в Гугле из за ChatGPT?
По слухам, Microsoft уже планируют интегрировать ChatGPT в Bing. [Прыгнуть на пост]

🌦 DeepMind представили SOTA модель GraphCast для прогноза погоды
По заверениям авторов, GraphCast значительно обходит конкурентов по точности предсказаний, а так же отличается эффективностью: предсказание на 10 суток вперед (35 Гб предсказанных данных) занимает менее минуты.

🔋 ML в ядерной энергетике
На хайпе от первых успешных опытов по достижению "грааля" ядерной энегретики [подробнее в канале Дениса], департамент энергетики США выделил $33M на исследования, связанные с машинным обучением, которые бы способствовали дальнейшему развитию технологии ядерного синтеза с чистым приростом энергии.

🔄 MetaAI представили Data2vec 2.0
Работа опирается на опубликованную в начале 2022 года статью data2vec - универсальный фреймворк, который обучается аналогичным образом на тексте / картинках / речи. Data2vec второй версии сравним по качеству с предшественником, однако оказывается на порядок быстрее. Опубликовали код и веса.

Читать предыдущий дайджест

@ai_newz

2023-01-07 09:23:43

⚡️Вот и первый конкурент ChatGPT подъехал, о чем я и говорил в предыдущем посте! Это чат бот Claude от стартапа AntropicAI. Он пока в пре-релизе, но уже есть примеры его работы.

Для теста Claude против ChatGPT их обоих попросили сравнить себя с машиной из книги "Кибериада" Станислава Лемма, которая может создавать объекты, чье название начинается на букву "n".

Мне кажется, Claude тут переплюнул ChatGPT.

Для выбора абсолютного победителя было бы интересно посмотреть, как они друг с другом переписываются в стиле рэп батла, например 😁.

@ai_newz

2023-01-07 08:41:17

OpenAI в 2021 году оценивалась в $14 млрд. Сейчас же после безудержного хайпа с ChatGPT Wall Street Journal говорит, что компанию оценивают в $29 млрд.

[Неплохой рост на фоне падающих акций FAANG.]

И по этой оценке OpenAI планируют продать shares венчурным капиталистам как минимум на $300 млн.

Что я думаю по этому поводу? Думаю, что это очередной пузырь, и в течение 6 месяцев появится не одна компания, которая покажет похожих по мощности чат ботов. Да и в опен-соурс что-то к тому времени просочится.

@ai_newz

2023-01-06 21:33:57

🔥VALL-E: новая zero-shot text2speech модель от Microsoft

Эта модель берет на вход текст и 3-х секундный семпл голоса, на выходе получаем аудиофайл, где проговаривается заданный текст. Причем сохраняется персональность, стиль и интонация.

То есть, чтобы сгенерить голос нового человека, не нужно тренировать модель заново — достаточно только показать модели трехсекундный семпл. Ух, заживём!

Архитектура модели смахивает на Dalle-1 и использует трансформеры. Не путать с Dalle-2, которая работает на диффузии.

Примеры генерации снизу.

Кода пока нет. И я немного сомневаюсь, что они его выложат.

❱❱ Сайт проекта

@ai_newz

2023-01-06 21:05:17

Канадская мафия.

* Для новеньких в канале – это 3 титана, которые получили премию Тьюринга в 2018 году за нейронные сети и глубокое обучение.

@ai_newz

2023-01-05 13:23:04

Немножко про плавный морфинг между сидами и запросами в Stable Diffusion. Код автор пока не выложил, но надеюсь, что код скоро будет. Ведь будет же?

@ai_newz

2023-01-04 16:28:56

Как вы знаете, Microsoft вкинул $1 млрд в OpenAI, и эти инвестиции включали соглашение о внедрении некоторых аспектов GPT в Bing. А сегодня пошел слух, что майки планируют интегрировать ChatGPT в свой убогий Bing и желают опять конкурировать с Гуглом.

Ну, посмотрим.

@ai_newz

2023-01-01 20:08:22

🎉С новым 2023 годом, друзья! Успехов вам в обучении, пониже лосс, повыше лернинг рейт, побольше новых нейронных связей. И пусть вы и ваши родные будут в безопасности.

П.с. наше число перевалило за 25к 🔥, значит будет стрим, как только я вернусь с новогодних каникул. Спасибо, что читаете!

@ai_newz

2022-12-30 16:50:00

Дизайнеры и иллюстраторы, вам пока рано бояться AI. Нужно его встречать и пользоваться новыми возможностями. Вот, например, аппка Wand позволяет последовательно генерить и изменять рисунок по вашим мазкам (даже с apple pencil) и текстовому описанию.

Симбиоз человека и машины во всей красе, ну, или хотя бы одна из первых его стадий. Дальше будет больше таких инструментов.

Подозреваю, что под капотом какая-то то адаптированная версия Stable Diffusion.

Можно уже записаться на бету.

@ai_newz

2022-12-30 10:46:00

🎸Принес вам список статей и ресурсов по multimodal learning для музыки. [Ссылка]

А если хотите генерировать музыку с помощью диффузионых моделей, то можете начать свое путешествие с Riffusion. Это тот же Stable Diffusion, которую зафайнтюнили на картинках аудио спектпограмм. Удивительно, но и это работает! И ее не трудно запустить локально.
[Онлайн демо]

@ai_newz

2022-12-29 19:32:01

Тем временем A.I. читает реп получше Дрейка. В работе ChatGPT + нейронка Uberduck, которая синтеризирует трек по тексту (платная фича) + человеческая креативность.

Теперь если буду делать подкаст, точно хочу себе собрать вступительный трек от AI-Дрейка.

@ai_newz

2022-12-28 11:09:25

Нейродайджест за неделю.

🧠 Диффузионные модели позволяют декодировать зрительные сигналы из мозга.
Модель использует сигнал полученный с МРТ мозга для восстановления изображения, которое видел человек. В большинстве примеров, приведенных в статье, качество пугающе хорошее.
[Сайт проекта]

🚗 Apple меняет планы по выпуску беспилотного автомобиля.
В отличие от изначального дизайна, который планировалось сделать полностью беспилотным, без руля и педалей, где все сиденья направлены в центр, в новом дизайне планируется водительское место с рулем, а так же автономное вождение будет работать только на шоссе. Выход запланирован в 2026 году.

🚨 Google бьет тревогу из за релиза ChatGPT,
которая потенциально может давать конкретный ответ на запрос вместо списка ссылок. Эксперты полагают, что Google предстоит решить, станет ли чат-бот новым способом поиска. Внедрение чат-бота для поиска несет риски появления токсичных и ошибочных ответов, на которые сложно согласиться крупной компании. Так же конкретный ответ из чат-бота затрудняет показ рекламы, которая генерирует до 80% прибыли Google.

🚀 OpenAI выпустили прототип 3D DALL-E для генерации 3D объектов.
Модель получила название Point-E. Она на два порядка быстрее DreamFusion, однако уступает по качеству.
[Прыгнуть на пост]

🚙 Waymo теперь производит беспилотные поездки по всему Сан-Франциско 24/7.

⏩ Статья от Джеффри Хинтона про Forward-Forward алгоритм обучения нейросетей
Алгоритм не требует запоминания активаций и расчета производных и, следовательно, способен работать с black-box модулями, для которых неизвестна точная последовательность вычислений. В ряде примеров Forward-Forward алгоритм не уступает backprop’у, однако по утверждению автора не готов заменить его полностью.

🎬 Создатели «Южного парка» привлекли $20 млн на развитие собственной дипфейк-студии.
Ранее студия представила свою технологию в клипе Кендрика Ламара The Heart Part 5.

👀 Scalable Diffusion Models with Transformers.
Работа от исследователей из UC Berkeley и NYU, в которой авторы заменяют U-Net backbone в text-2-image моделях на трансформеры.
[Прыгнуть на пост]

Друзья, знаю что у вас мало свободного времени, поэтому надеюсь вам понравилось читать новый короткий формат!

@ai_newz

2022-12-26 14:00:50

Вот так выглядит пайплайн GeoCode (нейронка + рендеринг в блендере).

@ai_newz

2022-12-26 13:59:00

GeoCode: Interpretable Shape Programs

Тут придумали метод генерации мебели по скетчкам и облакам 3Д точек. Кайф в том, что латентное пространство интерпретируемое и можно ручками подкрутить слайдер и поправить форму стула. Эффектный инструмент!

Жаль, что пока работает только на стульях, столах и сосудах. Под каждый вид мебели авторам, видать, пришлось вручную инженирить пайплайн для рендеринга в Blender, используя нейронные фичи.

❱❱ Сайт проекта
❱❱ Код

@ai_newz

2022-12-25 17:58:01

На рождество получил отличный подарок. Это библия Reinforcement Learning от Ричарда Саттона. Второе дополненное издание — особенно крутое.

Собираюсь за праздники подтянуть базу по RL. Советую эту книгу всем, кто хочет реально разобраться, на каких принципах работают, например:
- ChatGPT (это без комментариев)
- AlphaGo (победил чемпиона Европы в игру Go)
- AlphaStar (AI, который обыгрывает профессионалов в StarCraft)
- MuZero (умеет профессионально играть в кучу игр сразу, включая Go, шахматы, Atari и др)
- OpenAI Five (AI, который выносит людей в Доту 2)
и другие современные AI агенты.

❱❱ Вот тут есть PDF версия книги.

#книги

2022-12-25 12:10:40

Робопёсики поздравляют вас с католическим Рождеством и Наступающим Новым Годом, друзья!

@ai_newz

2022-12-24 21:11:54

А вот так выглядит сама архитектура скрытой диффузии на трансформерах (DiT) из предыдущего поста.

Все довольно простенько. Кондишенинг (time embedding, любые текстовые сигналы или лейблы классов для условной генерации) проталкивается с помощью adaptive layer normalization.

@ai_newz

2022-12-24 18:44:20

🔥Scalable Diffusion Models with Transformers (DiT)

Как вы заметили, текущие SOTA text-2-image модели вроде DALLE-2, и Stable Diffusion используют допотопную архитектуру U-Net в качестве бэкбона для процесса диффузии.

Один интерн из Meta AI покумекал и решил прикрутить в Latent Diffusion трансформер вместо морально устаревшего U-Neta (идея очевидная, да?). С небольшими трюками, позволяющими эффективно пробрасывать conditioning сигнал во все слои трансформера, мы получем SOTA в условной генерации изображений.

Из позитивных свойств, чем жирнее трансформер (количество слоев и их глубина) в диффузии, тем лучше качество генерации. Нам ещё предстоит понять, где этот предел в размере модели.

Архитектура модели довольна проста в реализации и занимает всего 300 строк кода.

На анимации – блуждание по латентному пространству модели.

❱❱ Код
❱❱ Сайт проекта
❤️ Поиграться в Коллабе

@ai_newz

2022-12-23 18:28:54

Друзья, жду вашего мнения по поводу контента. Проголосуйте в опросе.

2022-12-23 18:27:11

эйай ньюз pinned «🎙️Какой стрэм будем проводить на юбилейные 25000 подписчиков?»

2022-12-23 16:00:30

🤌How to Start a Startup: Делюсь читкодами для успешного основания стартапа

CS183B (How to Start a Startup, taught by Sam Altman с кучей приглашенных гостей) возможно один из лучших курсов Stanford’а за все время.

Курс, хоть и 2014 года, но все еще не потерял актуальность. Теперь только мысленно подставляйте слово AI в нужные места.

Все 20 лекций доступны тут.

@ai_newz

эйай ньюз страница 11. Показано 45 статей из 595