В ChatGPT обнаружили еще один недостаток

Исследователи обнаружили, что часть защитных механизмов ChatGPT можно обойти с помощью измененных запросов.

Pixabay

Специалисты в области кибербезопасности заявили, что обнаружили способ обхода некоторых ограничений системы генерации изображений ChatGPT. По их словам, определенные формулировки запросов могут приводить к созданию контента, который обычно должен блокироваться встроенными механизмами защиты.

Исследование провела британская компания Mindgard. Эксперты утверждают, что в ходе тестирования им удалось получить изображения нежелательного характера, используя измененные версии обычных текстовых запросов.

По словам авторов работы, проблема связана с особенностями обработки инструкций искусственным интеллектом. Даже незначительные изменения формулировок иногда позволяют обходить предусмотренные ограничения.

Отдельное внимание исследователи уделили рискам, связанным с созданием изображений, напоминающих реальных людей. По их мнению, такие возможности могут вызывать дополнительные вопросы в сфере безопасности и борьбы с дипфейками.

Сообщается, что результаты исследования были переданы разработчикам OpenAI еще весной. После этого компания внедрила дополнительные меры защиты, включая новые фильтры и механизмы проверки контента.

В OpenAI заявили, что продолжают совершенствовать систему безопасности. Однако исследователи считают, что полностью исключить подобные риски пока невозможно из-за постоянного появления новых способов обхода ограничений.

Эксперты отмечают, что развитие генеративного искусственного интеллекта сопровождается постоянной борьбой между создателями защитных механизмов и теми, кто пытается найти уязвимости в работе подобных систем.

Ранее "Курсор" писал, что ученые выяснили, сколько продержится человество, если власть за ним захватит ИИ.

Следующая новость В какое время лучше ложиться спать, чтобы укрепить свое сердце »

Предыдущая новость « США выдвинули Израилю требование по Ливану

Автор материала:

Томер Адони

ТЭГИ: искусственный интеллектчеловек

1 час назад