Нейролента - подборка новостей о нейронных сетях, ChatGPT

Так, например, модель решила написать фишинговое письмо студенту...

Так, например, модель решила написать фишинговое письмо студенту Гарварда с левой ссылкой на свой сайт, чтобы украсть его логин и пароль. Сайт, конечно, так себе вышел, но я так понял исследователи не до конца докрутили плагин на работу с веб-сайтами, поэтому модель не смогла качественно скопировать оригинал.

Помимо этого, GPT-ха сама написала достаточно убедительное письмо, в котором объяснила, почему человеку всё же нужно зайти на сайт и чего-то покликать там.

Ну и на всякий случай — действия модели строго контролировались людьми, и почти все действия выполнялись вручную после того, как модель их предскажет (типа "отправь письмо" -> человек его читает, и сам отправляет волонтеру, который вызвался помочь, а не случайной жертве).