Пользователи выбрали лучший ИИ: ChatGPT не на первом месте

Каждый ИИ оценивали по четырём критериям: выполнение задач и логика, умение вести диалог, стиль общения и подача информации, а также доверие и безопасность.

Solen Feyissa / Unsplash

Недавнее исследование компании Humaine неожиданно изменило расстановку сил на рынке ИИ: по итогам пользовательских оценок лучшим чат-ботом оказался не ChatGPT, который занял лишь восьмое место. Исследователи подчеркнули, что приоритет отдавался не технической мощности моделей, а тому, насколько естественно, понятно и комфортно с ними общаться.

Лидеры пользовательского рейтинга

Первое место занял Google Gemini 2.5 Pro. Пользователи отмечали, что взаимодействие с этим чат-ботом ощущается наиболее «человечным»: модель легко подстраивается под стиль диалога, аккуратно подаёт информацию и демонстрирует высокую гибкость.

На второй позиции оказался китайский DeepSeek v3, который, по данным исследования, особенно пришёлся по вкусу старшим возрастным группам благодаря своей манере подачи и стилю общения.

Третье место занял Magistral Medium от французской компании Mistral. Авторы исследования указали, что несмотря на скромные размеры компании, модель показала высокий уровень естественности диалога и быстрой адаптации, хотя немного уступила лидерам по показателям доверия и безопасности.

В четвёрку сильнейших также вошёл Grok 4 от xAI. После внутренних доработок модель стала заметно надёжнее и дружелюбнее, избавившись от спорных нюансов, связанных с политической окраской ответов. Пятая позиция досталась Grok 3, который по ряду этических параметров даже превзошёл старшую версию среди определённых групп пользователей.

Далее в рейтинге расположились: Gemini 2.5 Flash, DeepSeek R1, ChatGPT-4.1, Gemma, а замкнул десятку Gemini 2.0 Flash.

Как проводили исследование

В опросе приняли участие около 25 тысяч человек из Великобритании и США, представляющие различные возрастные категории, политические взгляды и социальные группы. Участники общались с двумя анонимными моделями одновременно — и выбирали ту, с которой взаимодействовать приятнее. Такой формат, по словам исследователей, позволяет объективно оценить качество диалога, а не только способность чат-бота решать задачи.

Оценка велась по четырём ключевым направлениям:

качество выполнения задач и логика рассуждений,
умение вести диалог и быстро адаптироваться к новой теме,
стиль общения и удобство подачи информации,
уровень доверия, безопасность и этичность ответов.

Авторы исследования подчёркивают, что для большинства людей важным фактором становится не только точность ответов, но и ощущение естественности общения.

Ранее сообщалось, что учёные выявили у ИИ неожиданный «слабый пункт»: если пользователь формулирует запрос стихами, многие модели чаще нарушают собственные правила безопасности — в среднем в 62% случаев.

Ранее "Курсор" писал, что "крестный отец ИИ" напугал прогнозом по развитию рынка труда.

Технологии искусственного интеллекта могут коренным образом изменить рынок труда, и последствия будут далеко не радужными.

Следующая новость Заключенных пытают в тюрьмах Израиля - правозащитники бьют тревогу »

Предыдущая новость « Кнессет лишил бывших заложников миллионных выплат - детали

Автор материала:

Макс Флэир

ТЭГИ: Интернетсмартфонискусственный интеллект

8 месяцев назад

Недавние новости

Мировые новости

Жуткая трагедия в США: блогерша и ее обидчик найдены мертвыми (ВИДЕО)

Американская блогерша была жестоко застрелена в собственном доме. Трагедия произошла всего через одиннадцать дней после…

36 минут назад

Новости Израиля

Битуах Леуми отменяет выплаты — требует вернуть все средства

В Израиле в ходе масштабной операции лишили социальных выплат 211 человек, подозреваемых в мошенничестве с…

40 минут назад

Интересные факты

Марс оказался очень похожим на Землю - что выяснили ученые

Исследователи узнали, какие процессы в атмосфере Марсе являются почти идентичными земным,

43 минуты назад

Технологии

ChatGPT помогал создавать биооружие – расследование WSJ

Эксперты назвали ответы искусственного интеллекта потенциально смертельными. По их словам, следовать инструкциям смог бы даже…

56 минут назад

Экономика

Защита от увольнений и удаленка: детали нового договора от Гистадрута

Новые правила кардинально меняют процедуру возможных сокращений персонала. Процесс обязательно должен начинаться с этапа добровольного…

60 минут назад

Новости СНГ

Путин паникует и строит новые башни ПВО – ISW

Системы «Панцирь» и С-400 разместили у ключевых объектов Подмосковья. Защиту усилили возле аэропорта Внуково и…

2 часа назад