Нейролента Mikitos.ru 2736 постов. Страница 53 (50 постов)
эйай ньюз 2023-03-02 13:18:28
🎙Сегодня у меня был первый опыт записи подкаста! И мне очень зашло, может стоит делать это более часто.
Меня пригласили записать подкаст про нейронную музыку, ну и порассуждать про AI в общем смысле. К середине марта выпуск будет готов, тогда опубликую подробности и ссылки.
@ai_newz
эйай ньюз 2023-03-02 09:08:31
В Ереване 6-7 марта пройдет 6-я конференция OpenTalks.AI по ML/DL. Для тех, кто раньше не слышал о ней, конфа независимая и организует ее известный в узких кругах и приятный человек Игорь Пивоваров.
Кроме традиционных блоков по CV, NLP и RL, в этом году еще новый блок по генеративным и диффузионным моделям. В каждом блоке большой обзор SOTA работ и секции по разработке и бизнесу.
Будет более 100 докладчиков, в том числе будут люди из Google, NVIDIA, Huawei, и др. Из Google Brain, например, будет Алексей Досовитский (топовый ресерчер с 45k+ цитирований). Спикеры будут в основном русскоязычные.
Жаль, сам я не смогу прилететь, потому что надо батрачить над статьями для ICCV. А так бы затусили в Ереване.
Вот тут вся программа.
@ai_newz
эйай ньюз 2023-03-01 18:45:28
Как я уже упоминал, OpenAI пытается позиционировать себя как продавец API к своим жирным SOTA моделям, ведь продукта то у них никакого нет.
Так вот сегодня они наконец открыли публичный API к своим ChatGPT и Whisper (распознавалка речи). Конечно, это не бесплатно. Но теперь любой может встроить AI-бота в свое приложение без усилий.
Одним из первых подсуетился Snap и уже запилил AI-друга для всех скучающих в Снэпчате. С ним можно поболтать, когда чувствуешь себя одиноко. Видимо с живыми пользователями в Снэпчате не очень 🌚
эйай ньюз 2023-02-28 18:17:00
RelightableHands: Efficient Neural Relighting of Articulated Hand Models
Reality Labs Research выпустила статью (принята на CVPR 2023) про нейронный рендеринг и релайтнинг рук. Знаю второго автора лично. Очень классные результаты.
Новая модель частично основана на технологии, которая используется в Codec Avatars.
Сайт проекта
Видео презентация
@ai_newz
эйай ньюз 2023-02-28 18:17:00
А вот и демонстрация RelightableHands из поста выше.
@ai_newz
эйай ньюз 2023-02-28 16:17:23
Мы живем в очень непростое время, за последние пару лет у многих из нас случилось немало потрясений и перемен. Из простого, вынужденный переезд в другую страну и расставание с близкими может вызвать тревогу, связанную с неопределенностью. Порой, чтобы справится с такими переживаниями и почувствовать себя спокойнее нужно поговорить со специалистом.
Я тоже решил попробовать пообщаться с психологом. Здорово, что сейчас появился удобный онлайн сервис "Ясно”, который позволяет подобрать и провести видео-консультацию с психологом. Продуманность ощущается на этапе регистрации: за пару минут заполняешь анкету, и умный алгоритм подбирает 12 специалистов, работающих именно с твоим запросом. Созвониться со своим психологом можно в любое выбранное время и с любого девайса, даже с телефона, что очень удобно. Сессии проводятся по встроенной видеосвязи на сайте сервиса или в приложении и гарантируется максимальная конфиденциальность.
“Ясно” серьезно подходит к подбору терапевтов для своего сервиса. Каждый из терапевтов имеет не менее 3х лет опыта консультирования, проходит личное собеседование и предоставляет рекомендации. Такой строгий отбор на “Ясно” проходит меньше 17% терапевтов.
Можно получить бесконечное количество знаний, но как их комбинировать между собой, применять по делу, а также максимально бережно искать и находить ответы в своей внутренней энциклопедии — стоит попробовать понять, пообщавшись с психологом.
Записаться к проверенному терапевту из “Ясно” можно по ссылке, а при регистрации по промокоду AI20 вы получите скидку в 20% на первую сессию.
#промо
эйай ньюз 2023-02-28 11:28:35
Нейродайджест за неделю (#9):
Я нечасто постил на прошлой неделе, однако произошло много интересного. Вот тут несколько хайлайтов.
🔥 LLaMA - новая языковая модель от Meta AI
LLaMA - семейство моделей (7, 13, 33 и 65 млрд параметров). При том, что количество параметров у LLaMA на порядок меньше, она может превосходить GPT-3 по качеству на бенчмарках. Что не менее важно, Meta релизит веса для исследователей.
🛞 Стартап Амазона Zoox, производящий автономные такси, получил разрешение на поездки
В машине полностью отсутствует руль и педали. Однако, пока что, тестирование на дорогах общего пользования сильно ограничено: ездить можно только по выходным, не более 65км/ч и только в отведенных районах.
🤗 Библиотека PEFT от Hugging Face для эффективного файн-тьюнинга
PEFT интегрирован с HF Accelerate и позволяет оптимизировать только часть параметров, что значительно экономит необходимые ресурсы. Как прмер, авторы приводят файнтьюнинг bigscience/T0_3B (3B params), для которой требования VRAM снизились с ~50Gb до 15Gb.
⚡Либа FlexGen позволяет запустить огромную языковую модель типа OPT-175B/GPT-3 на одной видеокарте 16 GB VRAM. Вот только нужно 200Gb оперативки.
📈 Трендовый гайд по промпт-инженерингу
Хочешь красивую генерацию – люби и промпты подбирать. В репе есть примеры инженеринга промтов для разных задач, а так же лекция и другие материалы на тему.
👀 Grid-search по лекарствам против рака с помощью Компьютерного зрения.
Ученые испытывали препараты не на раковом больном, а параллельно на десятках образцах его тканей. При этом, за изменениями в целевых клетках, наблюдала нейронка, которая позволяла отмечать даже малые изменения в клетках после терапии. В итоге смогли найти подходящее лекарство, про которое раньше даже и не думали, и у пациента началась ремиссия.
🔎 Google нашел новый эффективный оптимайзер – Lion. [Пост]
❱❱ Читать предыдущий нейродайджест
#дайджест
@ai_newz
эйай ньюз 2023-02-22 17:45:06
😎Avaturn: полный 3D аватар по трем селфи лица.
Мои кенты из стартапа in3D запустили новый продукт https://avaturn.me. Я участвовал в стартапе на его ранних порах в 2019, поэтому плотно слежу за его успехами. Disclaimer: это не реклама, потому что у меня нет никаких акций.
По трем селфи фоткам строят реалистичный аватар головы, далее вы можете выбрать себе тело, одежду и стиль причёски. На выходе получаем fully-rigged 3D аватар, который можно анимировать и экспортировать хоть куда. Круто, что всё работает в вебе и не нужно ставить никакую аппку.
Я протестил на себе, результат вы можете видеть на видео 😁.
Анонс в Твиттере: ссылка.
Лайк/репост приветствуется!
@ai_newz
эйай ньюз 2023-02-22 04:30:06
Че за Symbolic Search и как он ищет новые оптимизаторы?
Условно, Symbolic Search — это Эволюционый Поиск для программ на стероидах. Параллельно запускается целая популяция программ. Из них выбираются те, что лучше всего перформят на целевой задаче (в нашем случае — это оптимизация нейронок). Далее к лучшим применяются мутации, то есть в них случайным образом менется часть кода. И цикл продолжается.
Через много-много сожженных МВатт⋅часов мы получаем финальную програму с наилучшим перформансом на целевой задаче.
Для любопытных — подробности в блогпосте AutoML-Zero от гугла (2020).
@ai_newz
эйай ньюз 2023-02-22 00:36:46
🔥 Lion: EvoLved Sign Momentum - новый оптимайзер от Гугла
Google нашел новый алгоритм оптимизации при помощи Symbolic Search (завтра объясню, что это такое). Новый оптимайзер тупо мониторит momentum, а размер финального апдейта весов считается как sign(grad (1-β1) + β1 momentum)
. То есть апдейт для каждого элемента весов равен либо -1 * LR либо +1 * LR! train(weight, gradient, momentum, lr):
Просто волосы дыбом от тупости Lion, но он дает серьезные улучшения в скорости сходимости, да и в найденных локальных минимумах. Рвет и обычную классификацию и языковые модели и диффузионные.
update = interp(gradient, momentum, β1)
update = sign(update)
momentum = interp(gradient, momentum, β2)
// Тут я пропустил weight decay для простоты
update = update * lr
return update, momentum
Чем больше батч, тем лучше работает Lion. Еще он более устойчив к различным выборам гиперпараметров по сравнению с AdamW.
Уже попробовал на свои задачах, вроде работает!
❱❱ Код на PyTorch, JAX и TF
@ai_newz
эйай ньюз 2023-02-20 12:23:10
Нейродайджест за неделю (#8): Немного нового хайпа о языковых моделях
⚖️ 7-я крупнейшая юридическая компания интегрирует чатбот на базе LLM для своих 3.5 тыс сотрудников
Harvey - чатбот стартап, получивший $5M от OpenAI, специализированный для помощи юристам. Похоже, что не только айтишников будут увольнять.
🌌 Языковая модель на базе State Space Models (SSM)
Челы из Стенфорда опубликовали статью, где показали что SSM модель способна выдавать качество, сравнимое с моделями на базе трансформеров (на общих задачах), однако, обладает большей длительностью памяти и работает x2 быстрее. Интересный поворот, SSM – это прямо новая кровь. Вот статья и видео-разбор с авторами.
🏆 У Google подгорает. Нужно срочно улучшить качество чатбота, а в публичный тест модель не выкатить. Придумали выдавать ачивки своим сотрудникам, которые помогают исправлять ответы Bard (для RLHF). Геймификация наше все!
😰 Bing бот оказался гопником.
Появились видео, на которых бот ведет себя весьма токсично, к тому же затирает сообщения (это фича такая). Похоже, модель еще уязвима к разного рода промпт-атакам, и, кажется, еще весьма сырая для прода.
🧐 Минута ясности в пучине новостей про языковые модели, обзор текущей ситуации: стратегии Google, Microsoft, Baidu, и цена инференста модели с миллиардами параметров для миллиардов запросов [прыгнуть на пост]
❱❱ Читать предыдущий нейродайджест
#дайджест
@ai_newz
эйай ньюз 2023-02-19 14:34:19
Откуда AI хайп и почему именно сейчас?
И немного баек от меня.
Я начал заниматься Deep Learning в 2015 году, когда переехал в Германию. Даже тогда, когда уже прошло 3 года после появления культовой архитектуры AlexNet, еще не все из научного мира купили идею нейронных сетей. В нашей научной группе CompVis (где зародился Stable Diffusion) проф был из тех, кто еще не полностью поверил в силу Deep Learning, и и поэтому первые 3-4 месяца я большую часть своего времени провел за работой с SVM (Support Vector Machine)
Но, с первых дней я понемногу начал поглядывать и на нейросети вместе со своими постдоком. TensorFlow тогда еще не было, а правил бал Caffe из Berkeley AI Research – ужасно неудобный фреймворк, где сеть нужно было определять в protobuf файле из набора заготовленных слоев. Ни о каком autograd и речи не шло. В 2016 на NeurIPS вышла моя статья CliqueCNN про self-supervised learning, и она была первой статьей по нейросетям из нашей научной группы.
В общем, я к тому, что Deep Learning с нами уже довольно давно (ну, или не так давно, смотря как посмотреть), и трансформеры, то на чем строятся все современные языковые модели, изобрели в далеком 2017 году, но дикий хайп пошел только в 2023. Я за хайпом никогда не шел, и когда начинал PhD, о нейросетях не кричала каждая собака в твиттере. В 2019 году мне показалось: “Ну, вот сейчас пик популярности AI и Deep Learning, смотри как StyleGAN завирусился”. Но это был мой пузырь, и высокая популярность нейросеток тогда была только внутри научного мира. Появилась куча AI программ и толпы студентов пошли изучать такие sexу предметы, как Machine Learning и Data Science. Это было только начало.
Ну а теперь, в 2023, я вообще в шоке от того, что происходит. Все как будто с цепи сорвались с этим ChatGPT и китайскими клонами. Мне за последние две недели 4 раза предлагали дать интервью в разные онлайн издания по поводу AI. Забавно наблюдать FOMO не только у людей, но и у крупных технологических компаний, которые готовы рисковать репутацией, лишь бы запрыгнуть в хайп-трейн. Самое смешное, так это то из-за чего этот хайп формируется. По сути технология за ChatGPT не является прорывной, никакой AGI изобретен не был. Все что произошло — так это, OpenAI смогли красиво обернуть свою модель (за это им стоит отдать должное) и дать потрогать ее массе обывателей, далеким от технологий. Вот тут люди, которые не понимают как это все работает, очнулись и иcпытали катарсис. Про AI стали говорить из каждого утюга, гуру учат зарабатывать с помощью ChatGPT, а VC закричали “возьмите наши бабки”. Ведь, то что ты не понимаешь тебе кажется магией, и для многих ChatGPT действительно выглядит как что-то из будущего. Да, инструмент оказался полезный, и уже может автоматизировать некоторую рутинную работу с текстом и кодом. Но магического там мало – линейная алгебра, бро. И до того как чат-боты перестанут нести пургу с уверенным лицом и действительно поймут, как устроен наш мир, пройдет еще несколько лет (предсказание сугубо оптимистическое и неконкретное).
Так что, друзья, давайте лучше будем разбираться в технологиях, а не бежать за хайпом. Для этого мы тут и собрались.
#карьера
@ai_newz
эйай ньюз 2023-02-17 14:04:59
Buzz words уходят и приходят. А AI, стоящий за ними, остаётся все тем же.
Справедливость ради, поделом энэфтишкам — я считаю, что это был полный мрак.
@ai_newz
эйай ньюз 2023-02-16 13:21:25
Истерия с чат-ботами?
Micorosoft: Вкидывает $1 млрд в OpenAI, и инвестирует ещё $10 млрд сверху и пытается интегрировать ChatGPT и прочие языковые системы OpenAI в свои продукты. Надеются отожрать пару процентов рынка поиска у Гугла. Сейчас Bing-у принадлежит всего 3% поисковых запросов, но они оценивают эффект от получения каждого дополнительного процента на рынке поиска в +$2 млрд долларов годового оборота для компании. Ставки высоки. Недавно вышел казус с их ботом в Bing – его подвергли промпт-инъекции и выудили его внутренний свод правил.
Google: Видя успех ChatGPT и то, как в него запускают свои пальцы мелкомягкие, в Google начинают колотиться и пытаются выкатить в поиск своего чат-бота Bard, основанного на скандальной модели LaMDA (та от которой один из гугловкий инженеров поехал кукушкой в прошлом году). Но PR-компания Bard-a зашкваривается из-за глупости маркетологов, которые не проверили результаты генерации перед тем, как постить их в твиттер.
Baidu: В Китае тоже могут, поэтому они анонсировали своего чат-бота Ernie 3.0 Titan с 260 миллиардами параметров на базе их линейки моделей Ernie (об ERNIE-ViLG 2.0 для генерации изображений я писал тут). В итоге акции компании взлетают на 13% за день.
Идет какая-то нездоровая лихорадка с чат-ботами. Учитывая, что даже гиганты индустрии еще не готовы к финансовым тратам, которые потребуются для поддержания модели уровня ChatGPT в проде на всех пользователей. К примеру, гуглу инференс такой модели в проде обошёлся бы в $35 миллиардов в год, что примерно 65% текущего годового профита всего Гула. В этом блоге приведен интересный анализ этих расходов. Более того, пока не очень понятно как эффективно пропихивать рекламу в чат-боте.
@ai_newz
эйай ньюз 2023-02-14 12:32:38
Красиво сказал.
Ещё Лекун верит, что появятся новые более умные системы, и они не будут основаны на авторегрессионных LLM, как сейчас. Очень жду!
@ai_newz
эйай ньюз 2023-02-14 06:00:55
🔥 Один челик в инсте уже протестировал сетку Gen-1 для стилизации видео. О Gen-1 я недавно рассказывал тут.
Выглядит прям огонь! Для криэйтеров и артистов самое то.
На вход видео и стилевая картинка (она снизу). Кстати, стилевые картинки чел сгенерил в Midjorney.
@ai_newz
эйай ньюз 2023-02-14 06:00:55
И вот ещё одна стилизация с помощью Gen-1 от donalleniii.
Довольно стабильная картинка, хотя и камера почти не движется, а это самый лёгкий кейс (говорю как эксперт по стилизации с помощью нейронок).
@ai_newz
эйай ньюз 2023-02-13 15:03:14
Мне уже набили оскомину все эти генерации картинок и текста. Давайте поговорим о спорте.
Там нет такого хайпа, но в профессиональном спорте уже приличное время применяются нейронки для анализа, подведения статистики и выявления нарушений. Где-то в канале был пост про применение сетей на олимпийских играх, но лень искать.
А стартапчик jabbr.ai фокусируется на анализе бокса.
Для каждого боксера ведётся 50 различных метрик: удары, работа ногами, баланс, и т.д. Удивительно, как много всякой статистики можно вытащить нейронками. Хотя нет, это уже не удивительно 😄.
@ai_newz
эйай ньюз 2023-02-12 20:19:45
Нейродайджест за неделю (#7)
Неделя получилась горячая, наверно никого не обошли новости противостояния титана поиска Гугла и цунами ChatGPT и ее внедрение в Bing.
Если вдруг вы что то пропустили:
📈 Майкрософт внезапно организовал закрытый ивент, на котором представили обновленный поисковик Bing и бразуер Edge, которые теперь обладают силой ChatGPT. Сейчас чтобы попробовать новый Bing нужно записаться в лист ожидания.
📉 Следом и Гугл организовал свой ивент, на котором рассказал про свою подобную модель Bard. Однако мероприятие обратилось провалом: из за фактологической ошибки в сгенерированном ответе, акции компании обрушились, а сотрудники стали клепать мемы про CEO.
Очень интересно попробовать новый Bing в деле. Пока, кажется, что обычный ChatGPT отвечает получше поисковиков, основынных на LLM (хоть и врёт иногда).
❱❱ Читать предыдущий нейродайджест
#дайджест
@ai_newz
эйай ньюз 2023-02-11 14:33:59
Кстати, в комментах спрашивали, нахрена Microsoft интегрирует ChatGPT в свой браузер. Так вот вам ответ.
Модель прямо в браузере может суммаризировать 15-страничные PDF-ки и отвечать на вопросы по тексту документа. Довольно удобно, если работаешь с огромной свалкой статей или документов статей.
@ai_newz
эйай ньюз 2023-02-09 12:53:00
Мда, рыночек ошибок не прощает. Демка Bard обошлась Гуглу в 120 млрд долларов. И это не считая расходов на разработку 🥸. OpenAI, как закрытая компания (простите за каламбур), может себе позволить бóльшие риски с экспериментами.
Кстати, Андрей Карпатый возвращается в OpenAI. Напомню, что до этого он был один из AI директоров в Tesla, а в последнее время просто делал видосы на ютубе.
@ai_newz
эйай ньюз 2023-02-07 18:35:30
Интересненько. У Майкрософта сегодня внезапный ивент в офисе в Редмонде. Рассказывают, про то, какие крутые ИИ продукты они строят. Только что анонсировали поиск Bing и браузер Edge с ChatGPT и шлюхами. Ещё и Copilot в Edge будет! 🤯
Вот тут прямо сейчас идёт текстовая трансляция, если интересно.
П.с., не зря я сегодня немного акций Майкрософта прикупил.
@ai_newz
эйай ньюз 2023-02-06 20:07:48
Gen-1: The Next Step Forward for Generative AI
Полундра! Более качественные диффузионны модели по генерации и редактированию видео уже на подходе!
Мой одногруппник Патрик Эссер, один из авторов SD, который сейчас работает в RunwayML, выкатил новую диффузионку для видео. В основном она про стилизацию контента и изменению текстур.
♥️Модель умеет:
- Стилизовать видео по референсным картинкам стиля или тексту
- Сегментировать и изменять объект на видео по заданному промпту
- Рендерить синтетические данные в определенном стиле
💔Результаты лучше, чем то, что я видел до этого. Однако, видны и ограничения:
- В основном меняются только текстуры (а не геометрия)
- Довольно слабая консистентность текстур между соседними кадрами, если есть движение камеры (это болезнь многих Style Tranfer подходов)
- Разрешение и Детализированность сгенерированных видео все еще оставляет желать лучшего.
Конечно, это только начальные шаги развития в сфере генераци видео, и нас ждут более мощные модели!
❱❱ Сайт проекта
@ai_newz
эйай ньюз 2023-02-05 15:50:04
Нейродайджест за неделю (#6)
🤓 Математические способности ChatGPT
Исследователи сравнили способности ChatGPT решать математические задачи уровня выпускника ВУЗа. Задачи формулировались на естественном языке с использованием Latex для формул, напримерSuppose X is a vector space. Prove that $0x = 0 = a0$ if $x in X$ and $a$ is a scalar.
Пока что модель значительно проигрывает среднему выпускнику. Авторы так же планируют выложить датасет, так что можно будет сравнить свои скиллы против AI.
🔎 OpenAI представил тулзу для детекции сгенерированного текста
Однако в пояснении к модели явно указано, что авторы еще не оценили качество классификации досконально. Кажется, пока не очень хорошо работает.
🌟 BuzzFeed планирует использовать AI для помощи в генерации персонализированного контента
На фоне этого сообщения акции компании взлетези на 150%.
📈 Гугл планирует показать демо поискового движка с чатботом
А так же множество новых продуктов, основанных на AI. После выхода ChatGPT и объявления "code red" в Гугле, к вопросу подключились даже основатели - Сергей Брин и Ларри Пейдж, которые в последнее время отошли от дел. Сергей даже закоммитил код в прод.
📖 Семинар от Стенфорда про GPT [прыгнуть на пост]
🖌️ Появился бесплатный опенсоурсный плагин для Photoshop со Stable Diffusion
[прыгнуть на пост]
❱❱ Читать предыдущий нейродайджест
@ai_newz
эйай ньюз 2023-02-05 13:48:41
Инфоцыгане и всевозможные Гуру "зарабатывай $
Если бы все действительно было так просто, то они бы свои секретики заработка легких денег так не выдавали. ChatGPT — это не панацея, а инструмент.
Новые инструменты и технологии нужно изучать, чтобы идти в ногу с прогрессом и оставаться актуальным (или даже лидером) на рынке труда, но но нужно фильтровать информационный мусор.
@ai_newz
эйай ньюз 2023-02-04 15:36:09
Стартапчик Hex Magic запилил что-то типа помощника внутри Jupyter Notebook на базе языковой модели GPT-3 либо Codex.
У парней своя платформа, которая может чуть больше чем ноутбук — там можно и питон запускать и писать скрипты на SQL, и еще что-то, и во всем этом вам будет помогать LLM.
Забавная фича у них есть — если у вас скрэшилась ячейка в ноутбуке, то можно натравить языковыю модель найти ошибку и предложить автоматический фикс. Должно быть удобно для простых ошибок типа "забыл преременную инициализировать."
Идет закрытая бета, можно стать в очередь.
Почитать их блогпост
@ai_newz
эйай ньюз 2023-02-03 17:59:36
Навеяло.
@ai_newz
эйай ньюз 2023-02-03 13:31:11
Stanford Webinar - GPT-3 & Beyond
Вчера посмотрел эту прелестную лекцию из Стенфорда о новейших Языковых моделях. Проф С. Potts очень классно дал общий обзор языковых моделей и быстренько рассказал, как мы докатились до таких чудес как, например, GPT-3 и ChatGPT. Затем он порассуждал о том, в каких подтемах NLP можно еще что-то привнести обычному смертному, если у вас нет миллионов долларов на обучение SOTA моделей.
И вот какие актуальные темы для рисерча:
🔵 Retrival augmented in-context learning (условно, как поженить поиск и LLM)
🔵 Создание лучших бенчмарков, датасетов
🔵 "Last mile" for productive apps: Адаптация огромных моделей для конечных приложений, упрощающих жизнь
🔵 Исследования в сторону объяснения и верификации результатов, выданных LLM (огромными языковыми моделями).
Сами они в научной группе этого профа, с его слов, почти перестали тренировать модели и, кажется, занимаются промт-инженирингом и докручиванием уже натренированных LLM по вышеуказанным направлениям.
Получилась не очень тяжелая, но очень вдохновляющая лекция! Может после этого вы захотите написать диссер в области NLP. Ну, либо создать стартап.
@ai_newz
эйай ньюз 2023-02-03 03:35:02
🥂🍾 Нас теперь 26.000!
Очень рад видеть, как нас становится все больше и больше – энтузиастов и экспертов в эйай. Значит я пишу не зря и вы находите мой контент полезным/интересным. А это очень мотивирует.
Для новеньких: Добро пожаловать в наше уютненькое сообщество! А вот в этом посте я рассказывал про себя, и чем я занимаюсь.
Кстати, я не забыл про обещанный стрим по разбору статьи. Давайте остановимся на папирах по зрению, т.к. в этой области у меня наиболее глубокая экспертиза.
Накидайте статей в комментариях, которые бы вы хотели, чтоб я разобрал. Я сделаю шорт-лист и проведем голосование.
@ai_newz
эйай ньюз 2023-02-01 20:35:06
Гугл пытается выкатить на публику свою диалоговую систему LaMDA, очень уж ChatGPT хайпует. Можно записаться в вейтлист на получение доступа. Я уже жду.
Тем временем сегодня Сергей Брин в первые за годы закомитил код в прод. Совпадение?
@ai_newz
эйай ньюз 2023-01-31 18:23:00
Google Research, 2022 & beyond: Language, vision and generative models
Джефф Дин — это как раз тот чел из Гугла, который компилирует и запускает свой код перед коммитом, но только чтобы проверить на баги компилятор и CPU.
Так вот Джеф написал классный блогпост, подытоживающий, что же они там наделали за 2022 год в сфере языковых моделей, CV, мультимодальный моделей и генеративок. Хорошо для чтения на досуге.
@ai_newz
эйай ньюз 2023-01-31 12:17:10
В проекте по анализу картин во время моего PhD мне нужно было парсить сайты музеев и краулить картинки с них. Я часто пытался расколупать какую-то API и мне приходилось реверсинженерить скрипты на javascript. Так вот теперь бы у меня было гораздо меньше боли, потому что ChatGPT заявляет свое превосходство.
На вход - обфусцированный жабасскрипт. На выходе - нормальный код с вменяемыми названиями переменных и функций.
Если на пальцах, то это работает, потому что сеть бьет все на токены, да еще и во время обучения на исходниках она учит инвариантность к названиям объектов. Ведь в коде важнее инструкции и их последовательность, а не то как называется переменная.
🌀Еще, вчера вышло обновление ChatGPT, в котором ей добавили знаний по математике.
#карьера
@ai_newz
эйай ньюз 2023-01-30 18:03:46
Хорошие новости для представителей дизайнерских профессий. Теперь Stable Diffusion зашёл в Photoshop бесплатно (не то, что предыдущий плагин за $50/мес).
Более того новый плагин Stable.art ещё и в оупенсорсе и лежит на гитхабе. Плагин использует Automatic1111 как бекенд, который крутит сеть локально либо в Google Colab. Нужна только машина с GPU либо подписка на Коллаб.
@ai_newz
эйай ньюз 2023-01-29 16:22:49
Нейродайджест за неделю (#5)
🤯 Бекенд исключительно на GPT: проект победителей scaleAI хакатона
Участники реализовали приложение со списком дел, где функциональную часть бекенда заменили промптами для GPT. Чтобы не использовать БД, предыдущее состояне списка добавляется к текушему промпту. В результатае возможно задавать эндпроинты как deleteAllTodosDealingWithFood() или sorttodosbyestimatedtime(), которые не были определены в коде.
🧑🏫 Лекция от Andrej Karpathy по имплементации GPT с нуля
🦖 Разбавим новости про GPT и диффузионне модели: StyleGAN-T
Работает хуже, чем диффузия, но быстро (~0.1c). ГАНы все еще в деле! [Прыгнуть на пост]
👩💻 cursor.so: IDE в которой интеграция с AI-ассистентом выходит на новый уровень
Глубоко интегрированная LLM позволяет задавать открытые текстовые запросы, задавать вопросы про уже написанный код, описывать требуемые изменения и многое другое.
📈 Модели от OpenAI теперь доступны в рамках Azure OpenAI Service. Microsoft продолжает интегрировать технологии OpenAI.
🎷 MusicLM: Модель от гугла для генерации музыки по текстовому запросу.
MusicLM может генерировать семплы длиной в несколько минут с гармоничным звучанием. Модель так же может стилизовать по текстовому запросу обычные напевы в диктофон. Кода нет, но есть примеры.
🎧 playlistAI: Приложение, которое генерит плейлисты для Spotify и Apple Music по текстовому запросу.
🧠 Новое поколение поисковиков набирает обороты.
Пока Гуглу пытается угнаться за ChatGPT, несколько новых поисковиков-стартапов уже интегрировали LLM в свои продукты. Говорить, что они перевернули игру еще рано, но уже можно затестить. [Прыгнуть на пост]
❱❱ Читать предыдущий нейродайджест
@ai_newz
эйай ньюз 2023-01-26 14:05:09
Ещё, кстати, данных для обучения всяких Copilot-ов прибавилось.
эйай ньюз 2023-01-26 13:14:23
🤬 Осторожно, нецензурщина!
Сегодня некий доброжелатель слил 44 гигов исходников разных продуктов Яндекса. Архив можно нагуглить, ссылку постить тут не буду.
Особо ничего полезного, свой Яндекс на коленке из этого снепшота не соберёшь, ведь очень много чего завязано на их инфру, да и код не полный.
Из занятного, там есть часть данных, на которых тренили, например Алису. На скринах стоп слова и всякие ругательства, которые, видимо, использовали чтобы "фильтровать базар" пользователей.
А теперь, представьте, что будет если дообучить LLM на этом богатстве и сделать матную Алису 2.0 без цензуры. Еще поставить такую у себя дома, чтобы гостей развлекала 😅.
@ai_newz
эйай ньюз 2023-01-25 12:20:58
Всем привет! Я недавно писал про платный поисковик kagi.com, который использует большие языковые модели (LLM) типа GPT-3.
Так вот появился ещё один поисковик you.com, который обучил свою модель, похожую на ChatGPT и встроил ее прямо в поиск. То есть можно искать страницы как обычно по запросу, а можно напрямую общаться с ботом, и он вам будет отвечать, ссылаясь на релевантные ссылки.
Я потестил его, спросил про Шмидхубера. Ботик справился хорошо, даже указал на известную критику Юргена (он ведь временами любит обосрать других ресерчеров). Но, конечно, стиль и тон ответа очень зависит от запроса.
Пока этот поиск в бете, но любой желающий может его попробовать бесплатно.
Кажется, Гуглу все же придется провести скорую модернизацию своего поиска. Очень много конкурентов появляется в последнее время. А я проведу эксперимент и попробую одну неделю пользоваться только you, потом расскажу свои впечатления.
@ai_newz
эйай ньюз 2023-01-24 14:16:26
Архитектура StyleGAN-T. Много интересных трюков, как и в каждой статье по StyleGAN.
@ai_newz
эйай ньюз 2023-01-24 14:14:48
StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-Image Synthesis
Вы, наверное заметили, что про Ганы (GANs) для генерации картинок никто больше не говорит, они как-то отъехали на задний план после появления диффузионных моделей типа SD. Все потому что их трудно тренировать и они часто коллапсируют. Единственное преимущество у Ганов было только в том, что они генерят картинку за один прогон (forward pass), а не за десятки прогонов, как диффузионные модели.
Но вот на поляну вышел новый игрок от Ганов -- StyleGAN-T. Это GAN для tex2image генерации, которые генерит достойные результаты, да еще и супер быстро (0.1 сек на картинку 512x512). Новая архитектура базируется на StyleGAN-XL, но переосмысливает дизайн генератора и дискриминатора и использует СLIP для alignment-а текстового промпта и сгенеренных картинок. См. архитектуру в посте ниже.
В общем, теперь StyleGAN-T генерит по тексту гораздо лучше, чем другие ганы и работает все очень быстро. Но, конечно о качестве полноразмерной модели SD там речи не идет, Ганы все еще всасывают. Но, думаю, все идет к тому, что через ~1 год мы сможем генерить супер качественные картинки по тексту за время в пределах 1 секунды. И будет это что-то среднее между Ганом и диффузионной моделью.
❱❱ Сайт проекта (код скоро будет)
@ai_newz
эйай ньюз 2023-01-22 18:45:00
The Artificial Intelligence (AI) Residency Program
У Меты есть годовая программа AI Residency, на которой к вам приставят опытного ментора из числа ресерчеров, вы будете импелементить идеи и работать над научными публикациями и open-source проектами. То есть вас будут учить работе исследователя. Бэкраунгд в AI и Deep Learning не обязателен, но нужно иметь техническое образование.
Колобочки, это, кажется, лучшая возможность для тех, кто закончил бакалавриат или магу и хочет серьезно вкатиться в AI. По сути это своеобразные подготовительные курсы перед поступлением на профильное PhD. Если бы я знал в свое время о существовании таких программ, я бы точно не упустил ни одной возможности.
Подозреваю, что конкурс там будет не маленький, но я все равно рекомендую всем заинтересованным отправлять свои заявки.
Подать на программу в США можно тут до вечера 24 января.
@ai_newz
эйай ньюз 2023-01-22 17:32:25
Нейродайджест за неделю (#4)
🖼 Google Research представил свою Text-to-Image модель Muse
Модель обучается по текстовому эмбеддингу из предобученной LM предсказываиб маскированные токены изображения. Главная фишка Muse - это скорость генерации изображений: Muse на порядок обходит Imagen и LDM.
🧔3D Avatar Diffusion
Майкрософт выпустил диффузионную модель, которая способна построить 3D аватар по одной фотографии человека.
🙈 Нейросеть от Tencent Different Dimension Me превращает фото в аниме
[Немного треша в посте]
🎱 Очередная Yolo, уже V8
Авторы из Ultralytics проведут онлайн-семинар, посвященный новой версии, 24 января на YouTube
🕵️♀️ Художники подали в суд на Stability AI и Midjourney за нелицензированное использовагие их работ
[Прыгнуть на пост]
👨🎨 InstructPix2Pix: Редактор изображений с помощью текста от исследователей из Беркли на базе диффузионных моделей (с кодом и демкой) [Подробнее]
☠️ Лэйофы в индустрии: Google увольняет 12 тысяч сотрудников, а Microsoft — 10 тысяч.
❱❱ Читать нейродайджест #3
@ai_newz
эйай ньюз 2023-01-21 19:12:33
Ещё хочу добавить. В такие кризисные времена, если вы наемный работник в компании, то очень важно, чтобы вы работали на проектах, которые являются высокоприоритетными и стратегическими для компании. Ведь в первую очередь в расход пойдут те, кто работают над низкоприоритетными задачами.
эйай ньюз 2023-01-21 18:51:04
К слову про увольнения. Вот иконографика количества уволенных из tech индустрии в 2022. А в этом году по данным https://layoffs.fyi в tech секторе в среднем увольняют по 2600 человек в день.
Выглядит не утешительно, тут невольно начинаешь опасаться за свою задницу. Чтобы обезопасить себя нужно непрерывно развиваться и изучать новые технологии (я, конечно, говорю про AI инструменты тут). Прошло то время, когда ты мог 30 лет работать по профессии, которую получил в университете.
@ai_newz
эйай ньюз 2023-01-21 18:32:24
Бытует мнение, с которым я абсолютно согласен. Если Гугл не напряжется и не начнёт резко шипить (отгружать) в прод новые AI модели и развивать новые продукты на базе них, то компания канет в лету. В гугле очень много толковых ML инженеров и ресерчеров, но большинство из них начинают отгружать модели в прод, только когда они уходят работать в другие фирмы размером поменьше.
@ai_newz
эйай ньюз 2023-01-20 11:28:45
Google увольняет 12000 сотрудников. Сундар Пичай сегодня опубликовал открытое письмо всем гуглерам об этом нелёгком решении.
Но обещают инновации в сфере AI:
"I am confident about the huge opportunity in front of us thanks to the strength of our mission, the value of our products and services, and our early investments in AI."
Увольнения уже прокатились по всем крупным tech компаниям, не обошли и Гугл. Два дня назад, например, Microsoft анонсировал уже вторую волну увольнений на 10000 сотрудников.
@ai_newz
Neural Shit 2023-01-19 17:17:10
Робот Boston Dynamics помогает кожаному на "стройке"
Милота ❤️❤️❤️❤️
эйай ньюз 2023-01-19 12:03:28
Large Transformer Model Inference Optimization
Любителям погонять GPT-3 у себя на ноутбуке. Lilian Weng недавно написала объемный блог пост, про существующие техники ускорения и увеличения эффективности инференса больших языковых моделей, да и не только языковых, а больших трансформеров в целом.
Го читать статью!
А вот тут я ещё писал про ее топовый пост о диффузионках.
@ai_newz
эйай ньюз 2023-01-18 06:38:00
Это уже не смешно. Реально будет бублик что ли?
@ai_newz
эйай ньюз 2023-01-17 14:56:46
Твое 3D лицо, когда прогнал фото через 3D Avatar Diffusion 🌚
Правда, повторить дома не сможешь, потому что Microsoft никогда не публикует код от таких штук 👌.
@ai_newz
эйай ньюз 2023-01-17 13:28:04
Пайплайн 3D Avatar
Diffusion и примеры генерации 3D аватаров.
@ai_newz