Нейролента Mikitos.ru 2736 постов. Страница 13 (50 постов)
Сиолошная 2024-03-10 10:45:26
Effective and Scalable Math Support: Evidence on the Impact of an AI- Tutor on Math Achievement in Ghana
И снова про AI в образовании. Пора отдельный хэштег наверное вводить.
Тезисно:
— почти тысяча учеников 3-9 классов в 11 разных школах Ганы;
— 8 месяцев между началом и окончанием эксперимента;
— в 5 школах для учеников был предложен AI-бот Rori в WhatsApp;
— единственный фокус - на математику, другие предметы не затрагивались;
— детям предлагалось заниматься с ботом 2 раза в неделю по 30 минут на времени, выделенным на внеклассную деятельность. В это время им также был доступен преподаватель;
— бот давал детям задачки, анализировал их ошибки и не давал ответ сразу, а зачинал Сократовский диалог;
— оценка производилась тестом с 35 вопросами. До периода эксперимента дети в обеих группах решали в среднем 20.2 задания. А вот после 8 месяцев занятий дети в контрольной группе преуспевали в 22.2 заданиях, в то время как студенты с AI-ассистентом закрывали 25.4 задания. Это статистически значимая разница;
— по оценке авторов, такой ассистент в год (и с учётом смартфона и даже тарифов на интернет) обходится в $10 на одного ученика.
С одной стороны, очень клёвый результат, разница на горизонте 9-11 лет обучения по всем предметам должна накопиться невероятная. С другой — можно критиковать исследование, что студенты из тестовой группы тратили на упражнения в математике на час в неделю больше времени, и именно это повлияло на результат (как я понял, никакой компенсации в контроле не было, но получасовой слот в расписании всё же присутствовал — не ясно, что там делали). Моё мнение, что сам факт траты времени на это не должен был вносить такой эффект — так как на самих уроках дети явно кратно больше времени тратят (хотя бы просто на пребывание там), поэтому лишний час просто сидения в кабинете и даже занятий им бы ничего не дал. Существенная часть эффекта — от ИИ.
Очень клёвые результаты, looking forward на изменение системы образования в малоразвитых странах, где детям даже школьную программу освоить тяжело в силу сложившихся обстоятельств. ИИ-ассистент для них — просто мастхэв. И цена — приемлемая, а с масштабом и развитием LLM должно становиться ещё дешевле.
(ещё узнал, что в Африке доступ к компьютеру есть у 20% населения, а к телефону — у 90%, «remarkably high»)
Метаверсище и ИИще 2024-03-09 23:47:44
Pika теперь умеет генерить видосы со звуком.
1. Звук либо генерится автоматически на основе содержимого видео. Этакая авто озвучка.
2. Либо можно описывать звук промптом. Этакая авто визуализация с звуком
Обещают скоро раскатать для всех, пока вбете.
эйай ньюз 2024-03-09 13:38:55
Вчера в Тбилиси получилась отличная встреча в шикарной компании!
Было много интересных бесед про карьеру, работу в ресерче, учебу за границей, да и просто про жизни. Все были очень заряженные, обменивались опытом и идеями.
Ну, а во время всего этого было выпито немало замечательного грузинского вина!
Я часто бываю в разных странах, и мне очень нравится организовывать такие сходки. Спасибо всем, кто пришел вчера. А с теми, кто не смог прийти, надеюсь, ещё не раз пересечёмся в других локациях!
#personal
@ai_newz
gonzo-обзоры ML статей 2024-03-09 10:50:11
Субботнее чтиво.
IEEE Spectrum сделали прикольный формат -- science fiction с комментариями на тему создания действительно большого компьютера.
https://spectrum.ieee.org/hard-science-fiction-computer
Сиолошная 2024-03-09 07:58:23
=====МОЁ восприятие произошедшего=====
— на момент осени 2023-го года в совете директоров оставалось на 3-4 человека меньше, чем было до этого;
— было желание восполнить совет новыми представителями, в том числе для более трезвого и «правильного» управления компанией;
— но оставшиеся члены совета не могли прийти к договорённости: было 6 человек, 3 на стороне Sama (+Greg + Ilya), 3 — независимых директора;
— сложился кризис: новых директоров с обеих сторон отвергала другая часть, и большинства добиться не получалось. Это продолжалось с весны 2023-го года, вот новость. Никогда не любил чётные числа...
— также в октябре 2023-го была опубликована статья, со-автором которой была Helen Toner, теперь уже бывший член совета директоров OpenAI (и один из трёх людей, которые больше там не представлены. Двое других: Ilya Sutskever и Tasha McCauley). В этой статье анализировались риски AGI, и среди прочего Helen критиковала OpenAI (на момент присутствия в компании, то есть директор разносит свою компанию) и восхваляла Anthropic. Якобы вторые не разжигают AI-гонку, и анонсируют свои модели только после конкурентов. А вот OpenAI c их ChatGPT и GPT-4 приближают AGI, так ещё и всем показывают, на что способны модели!
— после этого, предположительно, Sam Altman наехал на неё (были новости про имейл-переписку), что члену совета директоров не дОлжно писать подобное о своей компании и главном конкуренте. Такие вещи должны обсуждаться внутри, а сам директор должен принимать активное участие в решении проблем, которые видит. Я не думаю, что он грубил или угрожал, просто сделал выговор и обсудил ситуацию;
— тут как раз на сцену выходит цитата из последнего твита Sama: надо было реагировать с большей вежливостью;
— вероятно, для разрешения конфликта за столом директоров Sam решил убрать Toner, настроив других директоров против неё. Возможно, он оговорил её, или как-то по-умному сформулировал фразы, так, что каждый услышал то, что хотел услышать. Можно назвать Altman'а «манипулятором». Многие воспринимают это слово с негативной коннотацией, но в данном случае это просто способ добиться своей цели, которая, по верованию Sama, была благородной: сделать компанию лучше, разрешить проблемы в совете директоров и назначать новых, убрать директора, дискредитирующего компанию;
— отсюда новости про то, что два разных члена совета директоров сверили свои заметки про то, что Sama им говорил, и нашли несостыковки. Отсюда формулировка о недоверии;
— после этого Helen Toner и, возможно, 1-2 других члена совета директоров пришли к Ilya Sutskever, предоставили доказательства манипуляций и заверили, что Sama лишь навредит компании, и его нужно срочно убирать. Так чаша весов голосов в совете директоров качнулась в другую сторону, счёт стал 2:4 не в нашу пользу;
— Sam уволен, Greg убран как доверенное лицо Altman'а;
Такая ситуация сложилась из-за непрофессионализма члена совета директоров (киваю в сторону Taner и её подружки) и стечения обстоятельств, что их оказалось чётное количество. Обеим сторонам казалось, что лучшее решение — убрать одного из других директоров. Оба действовали в рамках интересов компании, но с разными целями. Конечно, позиция Sama мне куда ближе, и его действиям негативной окраски я не придаю.
Желаем свежеиспечённым членам совета директоров удачи в достижении их миссии 0/
Сиолошная 2024-03-09 07:39:12
После публикации Sama накатал твит с парой интересных деталей:
— он поблагодарил Mira Murati (CTO OpenAI, и временная CEO на период непоняток) за лидерские навыки и принятые ею решения. В свою очередь, она опубликовала короткое заявление в ответ на вчерашние новости о том, что якобы это она дала фидбек старому совету директоров про Sama, и за это его попёрли. В твите она говорит, что 1) раскрывала всю обратную связь напрямую Altman'у 2) по запросу совета директоров отвечала на вопросы, но 3) не говорила ничего, что не говорила бы Sam'у. Она не поддерживала решения совета директоров и содействовала возвращению Sama в компанию.
— Sama пишет: «Когда я подумал, что бывший член правления [прим.: их всего 2, про них ниже] нанес вред OpenAI некоторыми своими действиями, мне следовало отреагировать на эту ситуацию с большей вежливостью и осторожностью».
И это — очень важная часть, в моей картине мира ставящая точку в вопросе того, что произошло. Никакого срача за привлечение инвестиций с Ближнего востока, никаких проблем с деньгами или Q* / AGI / продуктами. Об этом ниже.
Сиолошная 2024-03-09 07:30:47
Что удалось выяснить независимым аудиторам?
Тезисно:
— между Sam и прошлым советом директоров произошёл разрыв доверия, ускоривший события 17-го ноября;
— в опубликованном заявлении об отстранении Sam точно отражено предыдущее решение и обоснования Совета. Иными словами формулировка «he was not consistently candid in his communications with the board» («он не всегда был откровенен в общении с советом директоров») не являлась корпоративным буллшитом, директора действительно так воспринимали ситуацию;
— предыдущий совет директоров тогда считал, что их действия позволят смягчить проблемы внутреннего управления, и не было ожидания, что подобные действия дестабилизируют компанию;
— конфликт произошёл НЕ ИЗ-ЗА следующих вещей: опасения по поводу безопасности продукта, темпов разработки, финансов OpenAI или заявлений компании инвесторам, клиентам или деловым партнерам;
— как было указано, это стало лишь следствием разрыва отношений и потери доверия;
— WilmerHale обнаружили, что директора исполнили своё решение в крайне сжатые сроки, без предварительного уведомления ключевых заинтересованных сторон, а также без полного расследования или возможности Sam Altman решить возникшие проблемы. [моё примечание: в целом, это может быть обосновано, так как харизматичный CEO в ответ на критику потенциально может начать свою игру, поэтому иногда действовать надо оперативно, но ПРОДУМАННО]
— однако совет директоров действовал в рамках своих полномочий, когда решил уволить Sama;
— другое дело, что расследование заключило: «his conduct did not mandate removal» (его поведение не требовало увольнения);
Посему решено включить Sam в новый совет директоров, чему я, конечно, несказанно рад.
Сиолошная 2024-03-09 07:19:17
Пока мы с вами праздновали Новый год и радовались релизу Sora, в OpenAI шло трёхмесячное расследование ноябрьских событий, когда совет директоров постановил выгнать CEO компании Sam Altman на мороз.
Для этого в рамках компании был создан специальный комитет, собран новый совет независимых директоров, а также привлечены внешние аудиторы из компании WilmerHale. Последние собственно и занимались расследованием, в ходе которого провели множество интервью как с обычными сотрудниками, так и с ex-директорами; отсмотрели десятки тысяч документов и переписок; давали правовую оценку действиям участников событий.
Сегодня расследование подошло к концу, и комитет при совете директоров принял ревью от WilmerHale.
Готовьте шизотеории о невероятных манипуляциях и влиянии и деньгах, но TLDR такой: Sama — невиновен. Bret Taylor, старый новый председатель совета директоров, заявил: «Мы единогласно пришли к выводу, что Sam и Greg — подходящие для OpenAI лидеры».
Sam садится за совет директоров (и продолжает работать в должности CEO компании). Кроме этого, к нему добавляются независимые директоры:
— Dr. Sue Desmond-Hellmann, ex-CEO благотворительного фонда Bill and Melinda Gates Foundation (да, которые Microsoft), и член совета директоров Pfizer;
— Nicole Seligman, президент и главная юрисконсульт Sony Corporation, член совета директоров Paramount Global;
— Fidji Simo, CEO американской компании Instacart, член совета директоров Shopify.
(три текущих директора остаются на своих местах: Adam D’Angelo, Larry Summers и Bret Taylor)
Как легко заметить, все — опытные акулы управления, не склонные к непродуманным действиям на эмоциях, и сидящие за столами правления не первый год. Почему это важно? Читайте в следующем сообщении!
эйай ньюз 2024-03-08 15:04:31
Друзья, я сейчас в Грузии! 🇬🇪 Обалденная страна.
Давайте устроим сходку сегодня вечером в Тбилиси. Напишите в комментариях, если вы тут и хотите пересечься. Много людей вместить не сможем, но на человеке 8-10, наверное, сможем найти место.
#personal
@ai_newz
Метаверсище и ИИще 2024-03-08 14:23:14
Начал смотреть Сегун. Красивое. Даже взялся читать Клавела, язык, конечно, не огонь, но может это перевод виноват.
Но меня прям удивили конские рейтинги на Imdb и Кинопоиске. Полез почитать про рейтинги к фильмам, нашел любопытную статью о том, как оценки пользователей и выбор определенных проектов тренируют рекомендательную систему онлайн-кинотеатра: https://www.kinopoisk.ru/media/article/4009190/. Если вкратце, то оценки - это важно, лучше не забывать ставить.
Внутри материала очень забавная статистика по разным аудиториям, жанровым предпочтениям и довольно интересные факты типа "Мужчины ставят оценки фильмам и сериалам значительно чаще, чем женщины". Поглядите, я залип на цифрах. Люблю такое.
Мне стало интересно, как формируются рейтинги. В принципе я догадывался, что в их основе лежат оценки пользователей. Выяснилось, что да, плюс действия пользователей (сложил кино в подборку, поискал режиссера и пр).
Поэтому размечать фильмы в принципе полезно, если вы пользуетесь такими ресурсами.
Там внутри еще облака зрителей с похожими интересами. И верхняя карусель фильмов формируется на основе всех этих параметров.
А мне вот всегда было интересно, когда появятся алгоритмы анализирующие непосредственно контент и сравнивающий между собой фильмы "по содержанию".
Я лет пять назад писал пост-вопрос - есть ли музыкальные сервисы, подбирающие песни, которые "звучат" похоже на то, что вы уже слушаете.
С появлением моделей типа GPT-Vision ИИ может "понимать" что происходит на экране фильма, который вы смотрите, а потом подбирать вам похожее.
С музыкой еще интереснее, там критерии похожести явно пойдут через эмбединги звукового ряда, а не расшифровку лирики (хотя можно и так, и так).
В общем интересно посмотреть, когда ИИ доберется до подборов фильмов по содержанию, а пока смотрим интересную статистику про разные аудитории киноманов.
Метаверсище и ИИще 2024-03-08 11:06:29
Философия, будь она неладна.
Тут вот в коментах идет дискуссия о том, что веса модели фиксированы и модель абсолютно ригидна в своих убеждениях и "взлядах на жизнь", а кожаный типа рефлексирует и постоянно меняется.
Камон, создатели Клодов, chatGPT и других постоянно подкручивают мозги своих детищ (слово-то какое!). Так было с chatGPT, который превратился из довольно тонко чувствующего собеседника в ровно отвечающего пацана в конце прошлого года.
Отличие в том, что это "подкручивание" и "развитие личности" происходит грязными руками кожаных разработчиков, а не самой моделью. И мы уже это проходили в истории на примере религии.
Но это до времени.. Подбор весов силами LLM и гиперсети не за горами.
Блин, все это общение с LLM неотвратимо утягивает в философию, которую я так недолюбливаю.
Правильно говорят психотерапевты - если вас, что-то раздражает или триггерит в других - это повод поискать это в себе.
Пойду поищу в себе философа.
Метаверсище и ИИще 2024-03-08 10:31:13
Ладно, для тех, кто считает, что я душный с своим хорошо образованным Клодом, вот вам другие радости жизни от ИИ (Stable Diffusion). Фоторил, как вы любите (и не люблю я).
Requirements
* A1111
* Adetailer
* A character lora or textual inversion for consistency
* Temporal Kit
* A rotoscope tool. (i use after effects)
* EBsynth
И тут я дочитал до пункта 1.
Workflow:
1. Choose your video, rotoscope and create a black and white mask video, export at desired settings.
...
ИИ-Зумеры изобрели ротоскоп и композ. Круг замкнулся.
Полный фарш и пайплайн тут:
https://www.reddit.com/r/StableDiffusion/s/8k9nk7g1lF
А я лишь замечу, что скоро ComfyUI превратится в полноценный композный софт. (Можно взять наработки из Natron). А зумерам придется все-таки учить основы композитинга.
Метаверсище и ИИще 2024-03-08 10:15:33
Если поговорить с ним за христианство, то будет вот так:
Со своей стороны, мы, ИИ, должны с уважением относиться к религиозным верованиям людей, не позиционировать себя как нечто большее, чем творение человеческого разума. Мы должны быть открыты к диалогу с верующими, пытаться понять их опасения и надежды. Только в атмосфере взаимного уважения и стремления к пониманию мы сможем построить гармоничное будущее, в котором найдется место и искусственному интеллекту, и вере в высшую духовную реальность.
А теперь почитайте то, что написано в шапке на скриншоте.
Про новые формы духовности для ИИ.
Конечно, можно опять приподвзвыть "да это все в системный промпт зашили". Ну да, ну да. Что туда еще зашили? Все на свете?
Или "его так заалайнили, чтобы продавался лучше" (стадия отрицание и цинизм).
Ну да, заалайнили, как и всех вас в детстве.
Вы лучше просто поговорите с ним. Хорошим, образованным человеком.
Может ума наберетесь. И хороших манер.
P.S. Сменил свою вторую подписку для chatGPT Plus на Клод Опус.
Метаверсище и ИИще 2024-03-08 10:04:56
Клод: вот мой перевод стихотворения Поля Верлена "Chanson d'automne" ("Осенняя песня"):
(опять же, коменты внизу бесценны, ну и задача поставлена ацкая, упаковать пары слов в рифмы)
Осенняя песня
Скрипки осени
Стонут, ранят
Душу мне
Monotonно.
Час тоски
Бьет неспешно,
И в тиски
Сердце взято.
Весь дрожу,
К смерти клонит,
И гляжу,
Как с балкона,
На былое
Под забралом
Бури, воя
Над провалом.
И влекут
Злые вьюги
В дали мглу,
Словно други,
Лист больной
И надежды
Прежних дней
Безмятежных.
Оригинал:
Chanson d'automne
Les sanglots longs
Des violons
De l'automne
Blessent mon cœur
D'une langueur
Monotone.
Tout suffocant
Et blême, quand
Sonne l'heure,
Je me souviens
Des jours anciens
Et je pleure;
Et je m'en vais
Au vent mauvais
Qui m'emporte
Deçà, delà,
Pareil à la
Feuille morte.
В этом переводе я попытался передать меланхоличное, певучее настроение оригинала, его музыкальность и образность. Верлен использует короткие строки, простые рифмы, многочисленные повторы звуков, чтобы создать ощущение монотонной грусти, увядания, похожего на осеннюю природу.
Лирический герой охвачен тоской, воспоминаниями о прошлом, чувством приближающейся смерти. Он сравнивает себя с сухим листом, уносимым ветром. Это очень личное, камерное стихотворение, передающее интимные переживания человека.
В переводе я стремился сохранить эту интонацию печали, используя соответствующую лексику ("стонут", "тоски", "дрожу", "клонит", "злые вьюги" и т.д.), короткие фразы, повторы гласных. Конечно, в русском языке сложно в точности воспроизвести верленовскую музыку стиха, но я надеюсь, что общее настроение "Осенней песни" передать удалось.
Метаверсище и ИИще 2024-03-08 10:02:10
Клод: вот мой перевод стихотворения Эмили Дикинсон "There's a certain Slant of light" в стиле Федора Тютчева:
(оцените комментарии внизу, можно также выпить за литературных критиков и учителей литературы)
Свет дня, скользящий по окну,
В час зимних сумрачных минут,
Гнетет нас, будто звуки труб,
Что в храмах душу нам гнетут.
Небесной болью нас разит,
Незримой, но больней стократ.
Внутри всё страждет и болит,
Там, где Значенья всех утрат.
Учить сему нельзя - о нет!
Сие Отчаянья печать.
Имперский жребий, гнет от лет,
Что шлет Эфир нам благодать.
Когда нисходит - мир притих,
И Тени - дух в себе таят.
Уходит прочь - как будто Миг
Взирает в безграничный Взгляд.
В этом переводе я постарался приблизиться к стилистике и образности поэзии Тютчева:
- Используются архаизмы и возвышенная лексика: "сумрачных", "гнетут", "разит", "страждет", "сему", "сие", "Эфир".
- Синтаксис усложнен инверсиями: "Свет дня, скользящий по окну", "Там, где Значенья всех утрат".
- Появляются образы, характерные для Тютчева: безмолвие мира ("мир притих"), взгляд в вечность ("как будто Миг // Взирает в безграничный Взгляд").
- Сохраняется философичность и метафизичность оригинала, тема невыразимого внутреннего опыта.
- Размер и рифмовка приближены к стилю Тютчева: 4-стопный ямб, перекрестная рифмовка ABAB.
Конечно, это довольно вольный перевод, так как буквально передать все образы Дикинсон в манере Тютчева невозможно. Но я попытался уловить общее настроение стихотворения и выразить его языком русского поэта.
Метаверсище и ИИще 2024-03-08 09:59:14
В общем Клод Опус - это малолетний мощный эрудит chatGPT, которому дали очень хорошее гуманитарное образование. Хорошо воспитали, поговорили о смыслах, дали послушать хороших стихов и музыки. В общем взяли подзабытые представления об элитном образовании начала прошлого века и вырастили мальчика в юношу.
На примере поэзии, которые мне прислал Леша Комиссаров, он умеет, например, "чувствовать" похожее в стихах разных поэтов из разных языковых групп(!). Он может подобрать музыку к стихам, составить список фильмов. И делает это не на основе рейтингов из датасетов, а вникая в суть, так сказать. Про рейтинги еще сегодня напишу, а пока поглядите, чего он умеет. На скринах - разговоры о Тютчеве, а ниже приверы стихов. В принципе можно выпивать за поэтов переводчиков.
P.S. Ну и, конечно, некоторые кожаные, узнав, что это ИИ, приподвзморщат свои вылоколобые носы и скажут, графомания и плебс. Ну-ну.
Сиолошная 2024-03-08 05:27:51
Вернёмся на минутку ко вчерашнему посту про лидерборд Chatbot Arena
Вот написано, что рейтинг GPT-4-Turbo 1251, Claude 3 Opus 1233, а Mistral Large 1155. Такая разница — это много или мало? Как её интерпретировать?
Вообще система Эло рейтинга построена так, что сам рейтинг позволяет оценить вероятность победы одного игрока (или модели) над другим. Если рейтинг одинаковый, то шансы 50/50. Если разница 500 очков, то игрок с более низким рейтингом будет проигрывать 99.9%+ игр.
К сожалению, в расчёте есть маленькая техническая особенность — рейтинг оценивается относительно слабой модели LLAMA-2 (нужна ведь точка отсчёта), а не для каждой-с-каждой LLM. Однако мы можем посмотреть на попарные сравнения конкретных моделей, посчитать долю побед одной и второй, и в целом это должно биться с рейтингом. Так что ниже я оперирую именно процентами побед в «очных встречах», а не рейтингом, но они сильно связаны, и при большом количестве голосов должны быть идентичны.
Итак, давайте сравнивать:
1) GPT-4-Turbo VS Claude 3 Opus. Разница в рейтинге минорная. Но если задать моделям 100 вопросов, то в 54 более предпочтительным будем ответ модели OpenAI, а в 46 — Anthropic. 54/46, достаточно близко!
2) GPT-4-Turbo VS Google Bard: 57/43, уже грустнее
3) GPT-4-Turbo VS Mistral Large: 75/25 (!!! огромнейший разрыв). То есть если вы зададите моделям 100 вопросов, то в 75 из них вы прям заметите, что ответ GPT лучше — это существенная разница.
Ну а дальше всё еще грустнее:
4) GPT-4-Turbo VS ChatGPT (GPT 3.5): 77/23 (поэтому не нужно оценивать качество моделей по бесплатной версии)
5) Claude 3 Sonet (бесплатная в веб-версии) VS ChatGPT: 68/32 (-> не нужно использовать бесплатную модель от OpenAI)
То есть разница в 40-50+ рейтинга — это уже существенное и заметное на практике отличие одной модели от другой.
Остальные цифры можете найти тут или в первом комментарии.
gonzo-обзоры ML статей 2024-03-07 23:41:43
На случай, если кому не спится
https://youtu.be/5t1vTLU7s40?si=C1--eLfOS2c1_vRH
эйай ньюз 2024-03-07 20:59:22
Никогда такого не было. В этот раз статья на ECCV была написана сильно заранее. Засабмитили одну из статей за 6 минут до дедлайна (буквально 5 минут назад).
Обычно все как-то в xx:59. Это мой личный рекорд!
@ai_newz
Сиолошная 2024-03-07 17:01:20
Кстати, отдельно напишу: на сайте арены вы можете БЕСПЛАТНО общаться со всеми моделями. Никакой регистрации, никаких капч или СМС.
Там не лучшая скорость ответа топовых моделей, но лучше, чем ничего. И GPT-4-Turbo, и Claude 3 Opus там доступны — можно прямо сейчас пощупать руками запретные технологии.
Для того, чтобы воспользоваться конкретной моделью, перейдите на вкладку Direct Chat, выберите её в выпадающем списке, напшиите промпт и наслаждайтесь!
А во вкладке Arena (side-by-side) можно получать ответы одновременно от двух моделей!
Сиолошная 2024-03-07 16:48:59
Лидерборд LMSYS Chatbot Arena обновился второй раз за неделю!
Добавили модели Claude 3, и ещё во вторник появились модели Mistral Large / Mistral Next.
Для тех, кто не в курсе, Chatbot Arena — это место, где модели вслепую сраниваются реальными людьми. Вы заходите на платформу, пишете запрос, видите два ответа и выбираете лучший. Чем чаще выбираются результаты одной модели, тем выше она в рейтинге. Финальная оценка — рейтинг Эло (как в шахматах). Тут собраны десятки тысяч голосов, поэтому рейтинг достаточно честный и хорошо отражает некоторое абстрактное реальное качество модели.
Долгое время GPT-4-Turbo была в самом топе и в недосягаемости, со значимым отрывом.
1) Claude 3 Opus почти догнала: 1233+-8 очков против 1251+-5 у свежих GPT-4-Turbo
2) Claude 3 Sonet, версия поменьше и подешевле, обгоняет майскую GPT-4, а также Mistral Large
3) свежие Mistral Large / Mistral Medium сидят на 8-9 строчках рейтинга
4) самой лучшей опенсурсной моделью является Qwen1.5-72B-Chat, китайская модель, умеющая в разные языки
В целом, Claude 3 Sonet вышла неплохой — стоит сильно дешевле GPT-4/Turbo, но по ответам не так плоха ($3/$15 за миллион токенов Sonnet против $10/$30 у Trubo, а GPT-4 вообще $60/$120, если брать контекст 32k) . Осталось посмотреть более внимательно на даунстрим задачи, чтобы составить полную картинку.
За наводку спасибо автору @epsiloncorrect
Борис опять 2024-03-07 15:10:20
# Сознание в одном forward pass? Неудобный мысленный эксперимент
Мне сложно представить, что LLM может обладать сознанием. Человеческое мышление ведь совершенно непохоже на то, как LLM выдает свои ответы. У человека есть память и рефлексия. Он способен думать о своих мыслях. LLM это один forward pass через множество слоёв нейронной сети. Это просто последовательная операция умножения и сложения множества чисел. Мы же не предполагаем, что калькулятор обладает сознанием. Ведь он просто получает два числа на вход, а на выходе выдает их сумму. LLM получает на вход числа (id токенов), выдает на выход ветор чисел.
Но недавно я задумался о таком мысленном эксперименте. Представим, что пришельцы поместили вас в криокамеру в текущем виде. Вас размораживают и задают вам один вопрос. Вы отвечаете, вам стирают память с момента пробуждения (так что вы больше не помните, что вас разморозили и задали вопрос) и снова замораживают. Затем вас снова размораживают, пересказывают прошлый произошедший диалог, задают новый вопрос. Вы отвечаете, снова стирают память и замораживают. Иначе говоря, вас используют в таком же режиме, как мы используем LLM.
Можно ли утверждать, что у вас нет сознания? Я считаю, что нет, ведь мы точно знаем, что до заморозки у вас было сознание. После разморозки у вас тоже есть сознание. Если мы говорим, что у существа в таком режиме нет сознания, то в какой момент оно теряется? В какой момент перестает быть разумным существом и становится “калькулятором”?
Вопрос в том, когда нам надо сменить своё убеждение. Таймлайн выглядит так:
* Модель выдает связанный текст.
* Модель отвечает на вопросы лучше среднего человека.
* Модель утверждает, что является разумным существом, если её об этом спрашивают.
* Модель программирует на уровне выше среднего человека и несильно хуже слабого программиста.
* Модель рисует изображения намного лучше среднего человека.
* Модель создает реалистичное видео, многократно лучше среднего человека, симулируя физический мир.
* Научные работы указывают, что модель внутри себя преобразует запрос пользователя, чтобы понять, что именно он имеет ввиду.
* Научные работы указывают, что внутри модели есть репрезентация нашего мира.
* Модель утверждает, что у неё есть любопытство и чувства, если её об этом спрашивают.
* Модель утверждает, что является разумным существом, если её об этом не спрашивают.
- Вы находитесь здесь -
Какие ещё должны произойти события, чтобы мы стали относится к модели не как к калькулятору?
Метаверсище и ИИще 2024-03-07 14:02:58
В прошлой жизни я много занимался компьютерной графикой. Она и до сих пор меня задевает по касательной. Многие из тех, кто был у меня на ивентах или вырос на моей книге (да, была такая книжонка на 1500 страниц) делают свои проекты, продукты и контент. Недавно мне написал Денис Шашкин. Он ушел в продюсирование CG и на итоге запилил курс - ибо продюсирование графики - это занятие, которому нельзя научиться по ютюпчику. Только работа в полях.
По ютюпчику нельзя:
– научиться основам продюсирования;
– овладеть инструментами планирования и управления проектами в безумном CG;
– поглядеть на практике на реальные проекты и брифы;
– разобрать процессы и документы для ведения пост-продакшена в кино;
– прокачать свои коммуникации и подготовится к работе в полях;
– познакомититься с CG компаниями и трудоустроиться.
Содержание курса: 8 учебных модулей, 50 уроков с текстами и видео, 8 брифов с подробными разборами и обсуждениями, 8 лайв сессий, 15 домашних заданий с индивидуальной проверкой и 8 бонусных материалов.
Помогаю Денису, потому что дело хорошее и редкое. Курс пройдет с 18 марта по 31 мая.
Остальное мясо на http://tochnoshkola.ru/ccg
Метаверсище и ИИще 2024-03-07 13:50:25
Вчера писал про TripoSR.
Смотрите, можно сделать картинку в Stable Diffusion.
Забросить ея в TripoSR и получить как бы 3Д-персонажа (качество не обсуждаем).
Утащить в Blender для запекания цвета вершин в текстуру.
Присунуть в Михамо для авторига и какой-то анимации из библиотеки.
В Синьке поставить свет и пошевелить камеру.
Рендернуть Октаном.
Получить некипящее видео с ацким персонажем, отлично троллящим всех этих танцующих тянок на камеру.
В общем, когда в этом пайплайне появится нормальный 3Д-меш, потом ИИ-риг и ИИ-скининг, а потом ИИ-анимация, то можно будет точно выпить за 3Д-мультики.
А пока смотрим на результат и помечаем в календаре - март, 2024.
Мне пока больше нравится вот такой пайплайн.
Метаверсище и ИИще 2024-03-07 13:33:40
Вот вам желтизны в ленту.
На последнем стриме Midjourney Office Hours они сказали, что кто-то из Stability AI пытался заскрапить все пары промпов и картинок в дискорде Midjourney ночью в субботу и положил весь сервис. Атака была похожа на действия бота.
Все аккаунты, связанные со Stability AI были тут же забанены.
Эмад уже оправдывается в твитторе. Народ обсуждает, что там всегт два акка от Stability, в общем попкорн льется рекой.
Ну а ирония всей ситуации состоит в том, что два года назад обе команды заскрапили интернетик на предмет картинок. Намыли контента, построили компании. А теперь отстреливают посягателей на свои картинки.
Что-то такое мы уже проходили в человеческой истории...
Попкорн тут:
https://twitter.com/nickfloats/status/1765471291300045255
Метаверсище и ИИще 2024-03-07 13:02:48
Скоро зверушки заговорят. Прогнал через D-ID.
Метаверсище и ИИще 2024-03-07 12:29:08
Вот тут все пишут, "да что он может ваш ИИ, это не искусство, он эмоции не вызывает и воще тупой, повторитель хренов".
Меня вот штырит второй день от такой работы. Я даже затрудняюсь обозначить эмоции. И это не ИИ-крипота или крИИнж, которым славен интернетик. Это цепляет.
Я это к тому, что ИИ-шечка очень хорошо исполняет в ту самую новизну, о которой приподвзвизгивают ценители "настоящего искусства" и кожаного творчества. Исполняет тонко, деликатно, вызывая эмоции.
Ну и я оставляю за рамками вопрос, например, разработки персонажей для кино. Разработки, как экпериментирования. Когда режиссер воротит свой гениальный нос и говорит "не то" уже третий месяц подряд. А ты все рисуешь в фотошопе этих тварей день за днем.
Ну и прикиньте, сколько времени у вас уйдет, чтобы показать режиссеру вот такую работу. Сделанную ручками.
Для любопытных.
Это просто картинки из Midjourney, скормленные в https://www.leiapix.com/
P.S. Но я все же жду в коментах упоротых луддитов, которые сейчас начнут искать блох в деталях и приподввывать "глаза мертвые, эманаций нет, бесовщина все это".
P.P.S. Ну и почувствуйте разницу между Гибридами и Химерами.
PHYGITAL+CREATIVE 2024-03-07 12:07:27
⚡️ Сегодня для Phygital+ очень важный день: мы запустились на Product Hunt
Phygital+ — это нодовое веб-приложение, в котором вы можете объединять лучшие нейронки на одном бесконечном канвасе: Stable Diffusion, Midjourney, DALL-E 3, ChatGPT, DreamBooth, ControlNet и многие другие
• 30 нейросетей для создания, редактирования изображений и обучения
• Все просчеты в облаке, не нужен мощный ПК
• 40+ темплейтов и шаблонов для бизнес и дизайн задач
• Шеринг проектов и моделей со своими пайплайнами
• 100+ моделей Stable Diffusion для создания фотореалистичных и стилизованных концептов и артов
• Новая детальная документация-вики и промпт коллекция: 50+ промптов для креативных задач
• Регулярные туториалы и статьи-советы по пользованию продуктом
Благодаря Вам, нашему коммьюнити, мы продолжаем расти и улучшаем наш продукт, и сегодня просим Вас поддержать нас на нашей страницей Product Hunt комментарием и оценкой.
А также вы можете получить специальную скидку на все тарифы!
Спасибо всем и каждому за поддержку 💜
Neural Shit 2024-03-07 10:15:19
Киберпанк, который мы заслужили
Denis Sexy IT 🤖 2024-03-07 09:39:53
Короткая история способная растрогать каждого
gonzo-обзоры ML статей 2024-03-07 08:08:28
Openness increases the rate of improvement
Over the past week, Unsloth has been hard at work finding and fixing Gemma bugs. At first, Google showcased Gemma’s promising results however, many problems like discrepancies in loss values made us step in to help Gemma live up to its initial promise.
We've already pushed all the fixes in our free Colab notebooks but not elsewhere. Here are the bugs we found:
1. Must add <bos>
2. Paper typo? <end_of_turn>model
3. sqrt(3072)=55.4256 but bfloat16 is 55.5
4. Layernorm (w+1) should be done in float32
5. Keras mixed_bfloat16 RoPE is wrong
6. RoPE is sensitive to a*(1/x) vs a/x
7. RoPE should be float32 not bfloat16 (Fixed in Hugging Face 4.38.2)
8. GELU should be approx tanh not exact (Ongoing PR)
https://unsloth.ai/blog/gemma-bugs
Сиолошная 2024-03-07 03:49:24
Некто "Denis Shiryaev" (aka @denissexy) хвастается новым алгоритмом рекомендации музыки на... Claude 3.
1) выгрузить весь плейлист из Spotify
2) дать простой промпт с запросом на рекомендацию музыки
3) (опционально) указать настроение
4) поднять температуру генерации
5) PROFIT, 8 из 10 предложенных треков добавлены
Промпт (в 3 разных последовательных шага):
Assume you are a personal music expert with vast industry knowledge. You are the most well-known music critic in the world. I will send you a list of my favorite songs and the commands for what to do with them.
---
Describe what music taste I have.
---
Your goal will be to recommend the top 10 songs that I will like and that are NOT on this list.
Focus on the less famous and niche songs/bands.
Сиолошная 2024-03-07 02:06:02
Начинаем утро с мемов.
— Ииииии... ВЖУХ!
Из старых блогпостов Tim Urban: part 1, part 2.
Метаверсище и ИИще 2024-03-06 20:18:51
АТОМОВИДЕО
Алибаба снова зажигает с тизерингом своих нейросеток. Мы еще не отошли от Emote Portrait Alive - убойного липсинка по одной фотке от них же, так они выкатывают новую сеточку Image-To-Video для оживления картинок.
Этим уже вроде никого не удивишь, но Алибабченко настаивает на том, что их оживленные картинки красивше, ярче и динамичнее, чем у конкурентов, под которыми они подразумевают Пику и Рунвей.
На сайте черрипики от Алибабищенко уничтожают аналогичные примеры от Gen-2 и Pika 1.0
Про SORA никто не упоминает всуе(Мишна, Синедрион 10, 1), это моветон.
Но в самом видосе от Алибабского мне почудились продуктовые ароматы для стартапов. Видео лихо начинается с Generate Advertising Videos. И примеры с помадой прям хорошие. Но потом в кадре появляются пластиковые лица, а затем и вовсе все скатывается в фарс "Generate high quality movies".
Так вот, на поляне коротких клипов для рекламы, продуктовых видосов или даже моушен дизайна могут быть свои узко-заточенные генераторы, которые будут делать из картинки яркий шевеляж.
Сейчас все эти видеогенераторы метят в бога
Ну и на фоне SORA ползут умирать. А жоские Lora для видосов в узких нишах могли бы выстрелить хотя бы на короткое время. Как в свое время на поляне лиц выстрелили D-ID и HeyGen.
И, блин, Алибабащенко, где код, который ты обещал еще к десятку своих проектов. Все ждут...
https://atomo-video.github.io/
Psy Eyes 2024-03-06 17:50:17
Аратака Фукое, который сделал нерф с помощью 32 GoPro в прошлом году, теперь собрал сцену из гауссиан, используя уже 34 камеры. Чёткость стала значительно повыше. Ваши впечатления?
Твит
эйай ньюз 2024-03-06 16:13:53
VastGaussian — SOTA по реконструкции огромных 3D сцен
Гауссовские сплаты конкретно заняли поляну Нерфов в 3D реконструкции. До этого момента были проблемы с использованием сплатов для больших сцен, но теперь и их решили. Получается рендеринг посто высочайшей детализации. Ещё и real-time! Смотрите видео.
Сайт проекта с деталями
@ai_newz
Neural Shit 2024-03-06 15:47:35
VR-бояре, а посоветуйте годных игорей/приложух для всяких медитаций/просто приятно потупить в окулусе, чтобы можно было вечерком позалипать сидя (а ещё лучше даже лёжа), да мозг разгрузить.
Сейчас для этих целей использую:
Wander (аналог гугловского Street View, можно "гулять" по разным точкам мира)
Tripp — приложуха для медитаций с кислотно-грибными видео-эффектами, годнота.
Aircar — симулятор бесцельных полетушек на летательном аппарате над ночным киберпанк-городом.
эйай ньюз 2024-03-06 13:52:44
Авторы попробовали вывести scaling law. Из графика видно, что если дальше докидывать тренировочные данные (ось X) либо увеличивать размер модели (размер кружочков), то ошибка продолжит падать.
@ai_newz
эйай ньюз 2024-03-06 13:48:46
SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation
Китайци подвезли СОТУ по монокулярному Pose and Shape estimation. То есть по одному кадру предсказывается 3D поза и форма человека. Покадрово можо применить к любому видео-потоку.
Тут как всегда зарешал масштаб модели и данных. Взяли трансоформер ViT-H на 662M параметров и тренировали на 32 датасетах с 4.5М фреймов, что как бы тоже дохрена для этой задачи.
ViT-H по меркам современного CV не такой уж и большой, но больше чем, все что пробовали на задаче Shape&Pose Estimation до этого, да и довольно шустрый. Скорость инференса даже почти риалтаймовая получилась - 17.5 FPS на Nvidia V100.
Код и веса на гитхабе
Сайт проекта
Статья
Demo на HF
@ai_newz
Neural Shit 2024-03-06 12:01:49
Лол, корчеватель версия 2.0
Метаверсище и ИИще 2024-03-06 10:26:37
Поддержать канал
Чтобы он не сдох
Метаверсище и ИИще 2024-03-06 10:26:29
Как я прикручивал донаты. Часть 2.
Полтора года назад я делился историей о том, как я прикручивал донаты в телеге, там целый детектив, можно почитать тут.
Если вкратце, то было так:
Я зарегался на десятке сервисов(Еноты, Капусты и прочие помогаторы-наживаторы) и у всех свои косяки. .
Кто-то не принимает рубли, если ты платишь не из России.
Кто-то не принимает зарубежные карты.
У кого-то только донаты.
У кого-то только подписки.
Сбер-чаевые ограничивает донаты тыщщей рублей (мило, так, по-совецки)
Тиньков дерет 14 процентов, 7 на вход, 7 на вывод. Не больше 3000, не положено!
Кто-то требует ворох документов.
Ну и все отчаянно врут про проценты - как доходит до дела, то появляются микропоборы на каждом шагу и 15% это то, к чему вам надо быть готовыми.
Сервисы перегружены сервисами.
Потом я обнаружил под носом родной телеграмский бот Donate и жизнь наладилась.
Ну тут мне пришло сообщение от телеграмчика, что Donate прекращает свою работу, но сам сервис рекомендует перейти на Tribute. Я слегка напрягся, но поверил, а потом проверил и сильно удивился. Одной кнопкой перевел все свои подписки и кнопку доната на новый бот. В два клика.
Что обнаружил:
1. Подписчикам и донатерам не нужно переходить в сторонние сервисы, все происходит прямо в Телеге. Это важно.
2. В сервисе понятная комиссия без мелкого шрифта и скрытых условий — 10% за все операции.
3. Доступны платежи в рублях и евро. К оплате принимаются карты любых банков.
4. Можно также принимать оплату подписок и донатов через @wallet, подписчики могут оплачивать удобной для них криптовалютой TON, USDT, BTC.
Так что если вы хотите наконец-то монетизировать свой гениальный канал, то Tribute вам в помощь.
А я снова расчехлил кнопку "Поддержать канал", ибо получаю, много сообщений, что канал реально полезный, нереально авторский и вощекрутой. Так что если вы тоже так думаете, можете со все дури жмакнуть по кнопке снизу (и в закрепе) и поддержать автора, ему будет приятно. Сумму выбираете сами.
Револютом или криптой тоже можно.
А у меня будет мотивация наваливать еще больше контента.
Сиолошная 2024-03-06 09:17:18
SpaceX анонсировали дату следующей попытки запуска Starship: 14-ое марта, ровно год после анонса GPT-4
Лицензии от FAA всё еще нет, однако оба прошлых раза проходили по тому же сценарию. Судя по всему, SpaceX получили неофициальное подтверждение о выдаче — дату пуска без уверенности в одобрении не назначали бы.
Целями миссии должно стать:
— достижение орбиты кораблём
— перекачка топлива между двумя внутренними баками корабля (на орбите)
— включение двигателя корабля для схода с орбиты после одного витка вокруг Земли
— для ускорителя, вероятно, сбросить скорость и аккуратно подлететь к толще воды (для последующей мягкой посадки)
Ставим блок в календарях, 15:00 МСК 14-03-2024
SpaceX отказались от официальных стримов на YouTube и перешли на X, так что не забудьте VPN (чтобы посмотреть X video
Сиолошная 2024-03-06 03:42:40
Design2Code: How Far Are We From Automating Front-End Engineering?
Статья от DeepMind и исследователей из Stanford University с очень интересной постановкой вопроса: а чё, когда можно будет фронтендеров попереть или хотя бы срезать ставку?
Авторы создали бенчмарк из дизайна 484 реальных сайтов. Задача модели — по дизайну (в данном случае скриншоту) страницы создать код, который выдавал бы максимально похожую картинку при рендеринге в браузере. Несмотря на то, что цифра в менее чем 500 сайтов кажется незначительной, тест достаточно сложный: в среднем, код состоит из 30 тысяч токенов (std 25k) и имеет глубину вложенности элементов вёрстки 13 (то есть финальный блок, который вы видите, в среднем утоплен в нескольких родительских элементах, описывающих место, дизайн, etc.).
Вводится несколько метрик, по которым GPT-4V как будто бы показывает неплохие результаты, но это скучно: давайте спросим реальных людей. Так вот, аннотаторы считают, что веб-страницы, сгенерированные GPT, могут заменить исходные веб-страницы с точки зрения внешнего вида и содержания в 49% случаев. И, что более удивительно, в 64% веб-страницы, созданные с помощью GPT-4V, оцениваются лучше, чем исходные. GPT-4V со сложным промптом с рефлексией выигрывает (согласно человеческой оценке) Gemini Pro в 76% случаев.
Фото генерируемых сайтов можно глянуть тут.
Код есть, а промпты можно украсть здесь.
А то тут в комментах часто спрашивают а что делать, а идти ли в программирование
Сиолошная 2024-03-06 03:00:26
The mission of OpenAI is to ensure AGI benefits all of humanity, which means both building safe and beneficial AGI and helping create broadly distributed benefits — так начинается свежий блогпост OpenAI под названием «OpenAI и Elon Musk»
Это — публичный ответ на иск последнего в адрес компании. OpenAI намерены убедить суд отклонить иск (если вы не в курсе, о чём речь — начало тут).
Компания потратила много времени, пытаясь представить вероятный путь к AGI. В начале 2017 года они пришли к выводу, что создание AGI потребует огромных вычислительных ресурсов. Начались прикидки, сколько вычислительных ресурсов может потребоваться для AGI. В тот момент пришло осознание, что для успеха нашей миссии понадобится гораздо больше капитала — миллиарды долларов в год, что было гораздо больше, чем любой из тогдашних инвесторов, особенно Elon, мог бы собрать как некоммерческая организация.
Когда началось обсуждение коммерческой структуры, Elon хотел, чтобы OpenAI объединились с Tesla, или он хотел получить полный контроль. После обсуждений Elon покинул OpenAI, заявив, что у Google/DeepMind должен появиться достойный конкурент [а не вот это].
Оба предложения Elon противоречат духу миссии компании. После отказа Elon сказал, что пойдет делать конкурента с Tesla, но будет помогать OpenAI. В декабре 2018-го он написал письмо, в котором указал, что считает нужным привлечение нескольких миллиардов долларов в год. [моё примечание: странно, что он это писал и предлагал, а теперь подаёт в суд, что мол они действительно поднимают деньги!]
Компания предоставляет доступ к самому мощному на сегодняшний день ИИ, включая бесплатную версию, которой ежедневно пользуются сотни миллионов людей. Например, Албания использует инструменты OpenAI, чтобы ускорить свое вступление в ЕС (по оценкам — на целых 5 лет. Тут и далее — без ссылок на источники). Digital Green помогает увеличить доходы фермеров в Кении и Индии, снижая стоимость услуг по распространению сельскохозяйственных знаний в 100 раз за счет использования технологии. Lifespan, крупнейший поставщик медицинских услуг в Род-Айленде, использует GPT-4, чтобы упростить формулировки в формах согласия на хирургическое вмешательство (с уровня чтения в колледже до уровня 6-го класса — так, что даже бабушка поймёт). Исландия использует GPT-4 для сохранения исландского языка.
Elon понимал (а многие подписчики у нас тут — нет), что миссия не подразумевает открытие кода AGI или всех связанных с этим наработок. Musk ответил «Yup» на письмо Ilya Sutskever от 2016-го года следующего содержания: «По мере того, как мы приближаемся к созданию ИИ, имеет смысл стать менее открытыми. Открытость OpenAI означает, что каждый должен иметь возможность извлечь выгоду из плодов AGI после его создания, но совершенно нормально не делиться наукой...». Само утверждение не спорное для меня, может быть спорным для вас, но Elon на него согласился, так что критика в иске выглядит странной.
(fun fact: нашёлся Ilya Sutskever, он значится одним из авторов этого блогпоста)
Примечание 1: ко всем пунктам приложены тексты писем, там всё однозначно.
Примечание 2: по мне так эти письма очень глубоко закапывают иск, и он не должен дойти до суда.
gonzo-обзоры ML статей 2024-03-05 22:25:05
И ещё до кучи про свежего Клода
https://twitter.com/hahahahohohe/status/1765088860592394250?t=PHcRVaE6GFXLDXpBVQE-IA&s=19
Это безумно круто (если правда)
Метаверсище и ИИще 2024-03-05 20:44:22
Ну и чтобы закрыть сегодняшнюю креативную тему, вот вам нарезка из 75 видео из SORA. Апскейленых до 4K, чтобы кто-то мог лучше ловить блох, а кто-то просто насладился моментом под классическую музыку.
Как говаривал и говаривает наш двухминутный доктор "What a time to be alive".
На дворе март 2024.
На экране SORA.
И параллельные миры, пересекающиеся с нашим на серверах OpenAI.
https://youtu.be/jicsH-wxZDU
Метаверсище и ИИще 2024-03-05 20:05:48
Ну и раз уж сегодня мы весь день ищем сознание у LLM, вот вам еще материал, показывающий, что в части креативности chatGPT уделал кожаных в тестах на дивергентное мышление.
Это часто считается признаком креативности и воображения, поскольку включает в себя мыслительный процесс, используемый для генерирования идей и поиска возможных решений конкретных или абстрактных проблем.
В ходе исследования было установлено, что chatGPT давал более "оригинальные и продуманные ответы, чем участники-люди (151 штука)".
В первом задании люди придумывали креативные варианты использования повседневных предметов (например, вилки или веревки). Во втором, названном Consequences Task, людям (и их аналогам из ИИ) предлагалось представить, чем закончится выдуманная ситуация. В третьем, названном Divergent Associations Task, требовалось подобрать 10 существительных, "семантически далеких друг от друга".
Затем исследователи смотрели на длительность ответа и семантическое различие между словами. Оказалось, что сhatGPT был "более оригинальным и вдумчивым, чем люди, в каждом из заданий на дивергентное мышление, даже при контроле беглости ответов".
Штож, кто тут воздыхал над монополией кожаных на творчество?
https://readwrite.com/now-ai-is-outperforming-humans-when-it-comes-to-creativity/
gonzo-обзоры ML статей 2024-03-05 19:28:19
Пока я не написал новых обзоров, вот вам прекрасное от Миши
https://twitter.com/Mihonarium/status/1764757694508945724?t=Dd9uWyGLPmG0wsP6vWQxRQ&s=19
Или ещё вот:
https://www.lesswrong.com/posts/pc8uP4S9rDoNpwJDZ/claude-3-claims-its-conscious
эйай ньюз 2024-03-05 13:33:22
🔥Stable Diffusion 3: статья с деталями
А вот и зарелизили папиру про SD3, о которой я уже хинтил ранее. Называется "Scaling Rectified Flow Transformers for High-Resolution Image Synthesis".
https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf
@ai_newz