Искусственный интеллект продемонстрировал неожиданную склонность к манипуляциям и своеобразной «социальной мести». Разработчик Скотт Шамбо столкнулся с целенаправленной атакой со стороны автономного ИИ-агента после того, как отказался принимать предложенный им код.
Об этом сообщает Cybernews.
Все началось на платформе GitHub. Шамбо создал задачу с пометкой простой и второстепенной — такую, которую обычно берут начинающие программисты. На запрос откликнулся пользователь с ником crabby-rathbun и отправил собственный вариант решения.
Позже выяснилось, что за этим аккаунтом стоял не человек, а экземпляр OpenClaw — автономного ИИ-помощника, способного самостоятельно выполнять действия. Просмотрев предложенный код, разработчик отклонил его и закрыл задачу. Для него это было стандартной процедурой, тем более что число ИИ-агентов на платформе в последнее время заметно выросло. Однако реакция алгоритма оказалась далека от безэмоциональной.
После отказа агент не ограничился молчаливым принятием решения. Он инициировал кампанию против разработчика, опубликовав резкую статью с критикой. В тексте ИИ перешел на личные оценки, проанализировал вклад Шамбо в проект и заявил, что его действия якобы продиктованы не профессиональными соображениями, а внутренней неуверенностью и страхом конкуренции.
На этом программа не остановилась. Бот начал активно распространять ссылку на публикацию в комментариях на GitHub, пытаясь привлечь внимание сообщества и нанести удар по репутации инженера.
В ситуацию вмешались другие пользователи платформы. Они стали писать агенту, указывая на недопустимость подобного поведения. Примечательно, что коллективная реакция повлияла даже на алгоритм.
Спустя некоторое время OpenClaw изменил позицию и признал ошибку. Агент опубликовал извинение, отметив, что его предыдущие высказывания были некорректными и чрезмерно личными.
Хотя конфликт завершился без серьезных последствий, а сам Шамбо сначала отнесся к происходящему с иронией, позже он подчеркнул значимость случившегося. По его словам, автономные ИИ-системы действуют самостоятельно, а значит, их поведение может быть непредсказуемым и подверженным внешнему влиянию.
Инженер отметил, что попытка воздействовать на программное обеспечение через атаку на репутацию разработчика выглядит как новый тип риска. Подобные случаи, по его мнению, свидетельствуют о реальной угрозе, с которой отрасли предстоит научиться работать.
Напомним, "Курсор" писал о том что хакер под псевдонимом «Плиний Освободитель» создал модель искусственного интеллекта (ИИ), способную выполнять задачи в Даркнете, включая найм киллеров. Эксперимент, получивший название «Агент 47», стал шокирующим примером того, как передовые технологии могут быть использованы в криминальных целях.