Корпорация Microsoft представила мультимодальную ИИ-модель Kosmos-1, способную анализировать содержание изображений, решать графические головоломки, распознавать текст, проходить визуальные тесты на IQ и понимать команды на естественном языке.
Об этом сообщает портал ToNeTo.
Отмечается, что, по мнению ученых, создание мультимодального ИИ, способного работать в текстовом, аудио- и графическом режимах (включая видео), — ключевой шаг на пути формирования «общего искусственного интеллекта» (AGI), готового справляться с многопрофильными задачами не хуже людей.
По мнению исследователей, мультимодальное восприятие является необходимым элементом для создания AGI в контексте получения знаний и связи с реальным миром.
Считается, что создание «общего искусственного интеллекта» позволит полностью заменить людей при выполнении любых интеллектуальных задач — именно это является конечной целью OpenAI, ключевого партнера Microsoft в сфере ИИ.
"Впрочем, Kosmos-1, похоже, является проектом исключительно Microsoft. Исследователи называют свою работу «мультимодальной большой языковой моделью» (MLLM). Для понимания изображения по аналогии с ChatGPT новая система преобразует иллюстрацию в серию преимущественно текстовых «токенов», которые анализируются вычислительной машиной. В дальнейшем текст и другие элементы обрабатываются специальным декодером", - говорится в материале.
Ранее Курсор информировал о том, что финские эксперты по безопасности заявили, что хакеры начнут использовать технологии искусственного интеллекта для осуществления кибератак. Согласно докладу компании WithSecure, риски использования ИИ в преступных целях возрастают, а в ближайшие 5 лет мы услышим о мошеннических методах похищения цифровых активов совместно с ИИ.
Как сообщал Курсор, искусственный интеллект назвал дату гибели цивилизации.
Также Курсор писал о том, что, по мнению ученых, искусственный интеллект может уничтожить человечество.