Нейролента - подборка новостей о нейронных сетях, ChatGPT

Свершилось: Google разродились своей моделью-конкурентом GPT-4

Свершилось: Google разродились своей моделью-конкурентом GPT-4.

🌐
Блогпост: https://blog.google/technology/ai/google-gemini-ai/
🌐 Более красиво оформленный блогпост: https://deepmind.google/technologies/gemini/

Доступны модели 3 форм-факторов: Ultra (самая большая), Pro и Nano. Последняя создана для работы на смартфонах (обещают нативную поддержку в Pixel 8 и далее) и существует в двух размерах: 1.8B и 3.25B. Эти модели получились методом дистилляции из старших братьев.

🔼 Заявляется State-of-the-Art качество на широком круге задач, но огромных разрывов на текстовых задачах нет (хотя в парочке всё же приятные приросты).

😮 Главная фишка — модели семейства Gemini мультимодальны, то есть поддерживают и картинки, и аудио, и даже видео. Так, например, распознавание голоса работает гораздо лучше, чем у OpenAI Whisper V2/V3.

И конечно же, Geminin станет новой моделью под капотом Google Bard — там лежит Pro модель, поиграться можно тут. Хотя не ясно, доступен ли он всем и прямо сейчас — возможно, писать ответы будет модель предыдущего поколения. Так что не спешим с выводами на основе пары тестов!

В начале 2024го года появится Bard Advanced, и там, как легко догадаться, будет модель Ultra.
А 13го декабря обещают доступ к API!

📄 PDF с тех. репортом: тык, но деталей почти нет.