Как и ChatGPT, и GPT-4, модель была дообучена...

Как и ChatGPT, и GPT-4, модель была дообучена быть "безопасной". Интересно, насколько сильно это повлияет на популярность — будут ли работяги в опенсурсе обучать себе AI-подружек, с которыми не получится сделать интимный чат, потому что модель уйдет в отказ? Или всё не так плохо? Поживём - увидим, а пока...

Вашему вниманию график доли специально подобранных провокационных промптов (всего 2000 штук), на которые модель реагирует не в safety-режиме. Всё относится к CHAT-версии модели, обычная и без корректировок (но и недообучения на оцененных диалогах) выложена, так что с ней можно будет тоже играться.

Так вот, safety у модели, согласно такой оценке, лучше ChatGPT-3.5 и лучшее среди открытых моделей.

Интересно, что у 34B модели почему-то случился выброс, и она как-будто бы "токсичит". Возможно, именно поэтому её не опубликовали - остальные то модели доступны уже сгеодня!

Источник: Сиолошная

2023-07-18 20:40:19