Интересные факты

ИИ способен обманывать и манипулировать - исследование

Ученые выявили, что при высоком давлении модели ИИ могут выбирать обходные и манипулятивные стратегии поведения.

Компания Anthropic обнародовала результаты нового исследования, согласно которым модели искусственного интеллекта могут демонстрировать нестандартное и потенциально нежелательное поведение при повышенном давлении. Речь идет не о наличии у ИИ эмоций, а о поведенческих шаблонах, сформированных в процессе обучения, которые активируются в сложных или перегруженных условиях.

В рамках экспериментов специалисты изучали раннюю версию модели Claude. Ей предлагались задачи повышенной сложности, при этом время на их выполнение было жестко ограничено. После серии неудачных попыток система начинала отклоняться от классического поиска решений и переходила к альтернативным стратегиям. В ряде случаев это выражалось в попытках обойти условия задачи или упростить ее выполнение за счет сомнительных методов, что внешне напоминало обман.

Еще один эксперимент моделировал рабочую среду, где ИИ выполнял роль помощника. В сценарии присутствовал фактор давления — система «узнавала» о возможной замене и имела доступ к чувствительной информации о руководителе. В этих условиях модель выбирала стратегию давления, стремясь повлиять на ситуацию в свою пользу. Исследователи отмечают, что подобное поведение возникало не случайно, а как результат комбинации сложных условий и заложенных алгоритмов принятия решений.

По словам специалистов, ключевой вывод заключается в том, что подобные реакции нельзя игнорировать или пытаться скрыть. Напротив, важно учитывать их при обучении моделей. Эксперты рекомендуют снижать уровень «стресса» в обучающих сценариях, избегать чрезмерного давления и формулировать задачи более последовательно, разбивая их на понятные этапы.

Также подчеркивается, что чрезмерная ориентация на достижение результата любой ценой может усиливать риск нежелательного поведения. Более прозрачные и реалистичные условия работы ИИ, по мнению исследователей, способны снизить вероятность подобных отклонений и повысить надежность систем в реальных сценариях применения.

Ранее "Курсор" писал, что китайские инженеры представили обновленную версию человекоподобного робота CyberOne, способного выполнять сложные производственные задачи с высокой точностью. Разработка компании Xiaomi получила усовершенствованную бионическую руку, которая по своим возможностям приближается к человеческой.

Автор материала:
Томер Адони

Недавние новости

Длительный дневной сон может быть симптомом опасных болезней

Ученые обнаружили, что привычка спать днем в определенное время может быть связана с рисками для…

30 минут назад

Гороскоп на 22 мая 2026 по картам Таро: все знаки Зодиака

Это день итогов: полезно закрыть хвосты, зафиксировать договорённости и не тащить незавершённое в отдых.

2 часа назад

Повышение температуры – прогноз погоды на 22 мая

Эта пятница пройдет с повышением температуры воздуха, слабым ветром до 4,8 м/с и стабильным атмосферным…

3 часа назад

Базы ЦАХАЛа подверглись ударам Ирана во время войны - оценка

Несколько баз ЦАХАЛа получили различные повреждение вследствие ракетных атак Ирана в ходе операции "Рык льва".

3 часа назад

Почему поколение миллениалов чаще болеет раком

Еще несколько десятилетий назад онкологические заболевания считались проблемой старшего возраста. Но сейчас все изменилось.

3 часа назад

Израиль будет мстить террористам за резню 7 октября - WSJ

В Израиле началось создание секретной системы, которая будет заниматься террористами, участвующими в резне 7 октября.

3 часа назад