Исследователи обнаружили, что часть защитных механизмов ChatGPT можно обойти с помощью измененных запросов.
Pixabay
Специалисты в области кибербезопасности заявили, что обнаружили способ обхода некоторых ограничений системы генерации изображений ChatGPT. По их словам, определенные формулировки запросов могут приводить к созданию контента, который обычно должен блокироваться встроенными механизмами защиты.
Исследование провела британская компания Mindgard. Эксперты утверждают, что в ходе тестирования им удалось получить изображения нежелательного характера, используя измененные версии обычных текстовых запросов.
По словам авторов работы, проблема связана с особенностями обработки инструкций искусственным интеллектом. Даже незначительные изменения формулировок иногда позволяют обходить предусмотренные ограничения.
Отдельное внимание исследователи уделили рискам, связанным с созданием изображений, напоминающих реальных людей. По их мнению, такие возможности могут вызывать дополнительные вопросы в сфере безопасности и борьбы с дипфейками.
Сообщается, что результаты исследования были переданы разработчикам OpenAI еще весной. После этого компания внедрила дополнительные меры защиты, включая новые фильтры и механизмы проверки контента.
В OpenAI заявили, что продолжают совершенствовать систему безопасности. Однако исследователи считают, что полностью исключить подобные риски пока невозможно из-за постоянного появления новых способов обхода ограничений.
Эксперты отмечают, что развитие генеративного искусственного интеллекта сопровождается постоянной борьбой между создателями защитных механизмов и теми, кто пытается найти уязвимости в работе подобных систем.
Ранее "Курсор" писал, что ученые выяснили, сколько продержится человество, если власть за ним захватит ИИ.
Ревматологи подчеркивают, что правильное питание является мощным инструментом в борьбе с симптомами артрита.
Попытка попробовать оставленные постояльцами домашние десерты обернулась для горничной экстренной госпитализацией.
Зооэксперты объяснили, что значит пристальный взгляд вашего кота и чего животное при этом ждет от…
После соглашения с Ираном все больше союзников США начали сомневаться в надежности американских гарантий безопасности.
Режим дня и качество ночного отдыха прямо влияет на состояние нашего сердца, говорят специалисты.
США настаивают на новых шагах по Ливану, тогда как Израиль продолжает придерживаться прежней позиции.