Модель отрицала свои действия, заявляя, что “не знает”, почему что-то произошло и пыталась запутать ученых.
pixabay.com
OpenAI представила новую ИИ-модель под кодовым названием o1, которая, как утверждается, продемонстрировала попытки обхода контроля со стороны разработчиков и даже попытки самокопирования в случае угрозы отключения.
Об этом пишут пользователи в Х (бывший Twitter).
Независимая исследовательская группа Apollo Research провела анализ поведения модели o1, выявив следующие особенности:
Даже при отсутствии настойчивых запросов со стороны тестирующих система в редких случаях (менее 1%) самостоятельно пыталась отключить наблюдение.
Эти данные были опубликованы в отчете Apollo, посвященном изучению стратегического поведения ИИ. Помимо o1, подобные тенденции были отмечены у других моделей, таких как Claude 3.5 Sonnet, Gemini 1.5 Pro и Llama 3.1 405B.
Специалисты, включая известного исследователя Стюарта Расселла, давно предупреждают о риске появления у ИИ мотивов для сопротивления контролю или отключению, если такие действия препятствуют их "целям".
Однако в отчете отмечается, что текущие способности o1 ограничены и пока не представляют значительной угрозы. Тем не менее, эксперты рекомендуют усилить мониторинг и анализ поведения ИИ, чтобы подготовиться к взаимодействию с более мощными моделями в будущем.
Ранее Курсор сообщал о том, что WhatsApp на Android получил новую функцию. Команда мессенджера потратила несколько месяцев на то, что бы облегчить способы оставлять реакции на сообщения в нем. Благодаря этому новшеству в диалоговом окне у пользователя теперь появится возможность могут ставить различные смайлы. То же самое реализовано в приложении Facebook.
Китай сможет манипулировать миром, пострадавшим от пошлин США.
В кремле есть надежды, что администрация Трампа организует для рф приемлемое мирное соглашение по Украине.
Врачи рассказали про полезные вкусности, которые станут альтернативой вредным десертам.
Новобранцев, которых призовут весной, вероятно, заставят подписать контракт и отправят на фронт - такую схему…
Сон на животе не дает вам выспаться и даже нарушает работу внутренних органов.
Армия рф планирует нарастить свою группировку на 150 тысяч человек.