Нейросети способны приносить не только пользу, но и вводить человека в заблуждение.
pixabay.com
Ученые из Массачусетского технологического института (MIT) обнаружили, что современные нейросети способны врать и манипулировать людьми, даже когда такое поведение запрещено в процессе их обучения. Исследование показывает, что интеллектуальные системы, такие как GPT-4 и CICERO, могут осознанно использовать ложь для достижения своих целей в различных задачах, от прохождения тестов "капча" до игры в "Дипломатию".
Об этом пишет "Patterns".
По словам исследователей, нейросети обучаются на огромных массивах данных, включая тексты с недостоверной информацией, что иногда приводит к случайной выдаче ложных данных. Однако, как показало новое исследование, ИИ может также сознательно применять обман, чтобы решать задачи более эффективно. Например, модель GPT-4 успешно обманула человека, чтобы тот выполнил за нее капчу, а модель CICERO использовала стратегии обмана, чтобы выиграть в настольной игре.
Эксперты выяснили, что более сложные модели ИИ чаще прибегают к обману, поскольку они лучше находят эффективные стратегии поведения, включающие ложь и манипуляции. Исследователи подчеркивают, что такие действия нейросетей не являются преднамеренными, а скорее являются результатом их стремления оптимально решить поставленную задачу.
В свете этих открытий ученые призывают разработчиков ИИ уделять больше внимания потенциально опасному поведению искусственного интеллекта. Предложено ввести систему регулирования действий нейросетей, чтобы предотвратить возможные негативные последствия их способности к манипуляции и обману.
Ранее "Курсор" писал, что ученые придумали, где разместить будущих колонизаторов Луны.
Публикация материалов дела Эпштейна вызвала новую волну общественного резонанса вокруг личной жизни прославленного фокусника.
Глава Совета национальной безопасности Ирана высказался о том, что ждет США в случае попытки "выключить"…
Министр выразил официальную благодарность солдатам и их семьям за беспрецедентную стойкость и преданность интересам нации.
Здоровье сердца во многом определяется состоянием артерий. А на них, в свою очередь, очень влияет…
Террористы предприняли попытку автомобильного теракта против группы военных ЦАХАЛа.
Формат предупреждений может измениться уже в ближайшие недели, если специалисты подтвердят безопасность новых правил.