Нейролента - подборка новостей о нейронных сетях, ChatGPT

Вчера прошло незаметно на фоне

Вчера прошло незаметно на фоне анонса голосовых функций для ChatGPT, но шведская компания Spotify объявила, что запартнерилась с несколькими подкастерами для перевода их англоязычных выпусков на испанский с помощью нейросетей, а в ближайшие недели планирует выпустить переводы на французский и немецкий. Первая партия эпизодов уже доступна — можно слушать последние выпуски Dax Shepard, Monica Padman, Bill Simmons, Steven Bartlett и нашего любимого Lex Fridman.

Причём делается не только перевод и озвучка, но и полноценное копирование голоса и стиля (интонации) говорящего. Казалось бы, запартнерились со стартапом Heygen, про который я недавно писал, ан нет! Провайдер технологии — OpenAI
🤔
! До этого не было известно, что у них есть инструмент для подобного. Возможно, используется та же модель, что и для ChatGPT (просто там голоса строго заданы, а не склонированы с подкастеров). А для перевода речи в текст используется старый добрый Whisper, выпущенный OpenAI весной 2022го года. Статей и каких-либо деталей по синтезу и клонированию голоса нет 🤕 ну и ладно.

А ещё из вот этого твита стало известно, что над моделью работал Alec Radford — один из самых первых и талантливых исследователей в OpenAI. Он был соавтором GPT (1-2-3-4, причём для первых двух — первым автором), но после 2021го как-то пропал с радаров. По его LinkedIn я даже подумал, что он покинул OpenAI, но нет, ещё трудится на благо AGI
🤗