Технологии

Когда чат-боты "врут" чаще всего - исследование выявило интересную закономерность

Просьбы к чат-ботам давать краткие ответы могут привести к увеличению галлюцинаций.

Исследование компании Giskard, которая занимается созданием комплексного бенчмарка для оценки моделей искусственного интеллекта, выявило интересный парадокс: если попросить чат-бот отвечать как можно короче, вероятность возникновения «галлюцинаций» у него возрастает.

Об этом говорится в сообщении в блоге.

Специалисты отмечают, что такая особенность особенно выражена у наиболее продвинутых систем — например, GPT-4o от OpenAI, Mistral Large и Claude 3.7 Sonnet. При требовании быть лаконичными эти модели чаще допускают ошибки и выдают неточные данные.

Причина, по мнению исследователей, кроется в том, что короткий формат ответа лишает нейросеть возможности пояснять, уточнять или опровергать информацию. Для качественного фактического опровержения почти всегда требуется более развёрнутое объяснение.

«Когда системе задают установку отвечать предельно сжато, она неизбежно жертвует точностью в пользу краткости, — указывают авторы работы. — Это значит, что даже безобидные указания вроде "отвечайте коротко" могут серьёзно подорвать способность модели корректировать дезинформацию».

Кроме того, в отчёте подчеркивается ещё одна закономерность: если ложное утверждение сформулировано уверенно, многие модели предпочитают его не опровергать. Для разработчиков это создаёт непростую дилемму — что важнее, удобство для пользователя или сохранение надёжности выдачи.

Проблема «галлюцинаций» — генерации вымышленных или некорректных сведений — остаётся нерешённой даже для самых современных ИИ-систем. Более того, отмечается, что новейшие модели рассуждений, такие как OpenAI o3, нередко демонстрируют ещё более высокий уровень подобных ошибок, чем их предшественники.

Напомним, "Курсор" писал о том что хакер под псевдонимом «Плиний Освободитель» создал модель искусственного интеллекта (ИИ), способную выполнять задачи в Даркнете, включая найм киллеров. Эксперимент, получивший название «Агент 47», стал шокирующим примером того, как передовые технологии могут быть использованы в криминальных целях.

Автор материала:
Тали Малкина

Недавние новости

Скандал в Иране: вместо «Смерть Америке» прозвучало «Смерть Хаменеи»

Во время прямой трансляции в Иране репортёр вместо привычного лозунга «Смерть Америке» выкрикнул «Смерть Хаменеи»,…

2 минуты назад

Перемены в duty free Бен-Гуриона: что изменится до 15 марта

В duty free аэропорта Бен-Гурион запустили проект с личными видеопосланиями ко Дню святого Валентина и…

24 минуты назад

Ставки на Polymarket: солдаты ЦАХАЛа оказались в центре скандала

Спецслужбы раскрыли схему, в рамках которой резервисты ЦАХАЛа делали ставки на Polymarket, предположительно используя секретную…

31 минута назад

Драма в Ришон ле-Ционе: собака застряла в колодце с ядовитыми газами

Пожарные и специальные подразделения борются за жизнь собаки в опасном колодце с ядовитыми газами.

44 минуты назад

Названа самая здоровая еда в мире - что выяснили ученые

Какой продукт является самым здоровым в мире и почему его обязательно нужно включать в рацион…

49 минут назад

Готова ли ПВО к иранской атаке — в Rafael раскрыли результаты тестов

В Rafael сообщили, что провели тесты с обновлённой «Пращей Давида», успешно перехватив сложные цели над…

1 час назад