Доступны модели 3 форм-факторов: Ultra (самая большая), Pro и Nano. Последняя создана для работы на смартфонах (обещают нативную поддержку в Pixel 8 и далее) и существует в двух размерах: 1.8B и 3.25B. Эти модели получились методом дистилляции из старших братьев.
🔼 Заявляется State-of-the-Art качество на широком круге задач, но огромных разрывов на текстовых задачах нет (хотя в парочке всё же приятные приросты).
😮 Главная фишка — модели семейства Gemini мультимодальны, то есть поддерживают и картинки, и аудио, и даже видео. Так, например, распознавание голоса работает гораздо лучше, чем у OpenAI Whisper V2/V3.
И конечно же, Geminin станет новой моделью под капотом Google Bard — там лежит Pro модель, поиграться можно тут. Хотя не ясно, доступен ли он всем и прямо сейчас — возможно, писать ответы будет модель предыдущего поколения. Так что не спешим с выводами на основе пары тестов!
В начале 2024го года появится Bard Advanced, и там, как легко догадаться, будет модель Ultra. А 13го декабря обещают доступ к API!