Для понимания изображения по аналогии с ChatGPT новая система преобразует иллюстрацию в серию преимущественно текстовых «токенов», которые анализируются вычислительной машиной.
Pixabay
Корпорация Microsoft представила мультимодальную ИИ-модель Kosmos-1, способную анализировать содержание изображений, решать графические головоломки, распознавать текст, проходить визуальные тесты на IQ и понимать команды на естественном языке.
Об этом сообщает портал ToNeTo.
Отмечается, что, по мнению ученых, создание мультимодального ИИ, способного работать в текстовом, аудио- и графическом режимах (включая видео), — ключевой шаг на пути формирования «общего искусственного интеллекта» (AGI), готового справляться с многопрофильными задачами не хуже людей.
По мнению исследователей, мультимодальное восприятие является необходимым элементом для создания AGI в контексте получения знаний и связи с реальным миром.
Считается, что создание «общего искусственного интеллекта» позволит полностью заменить людей при выполнении любых интеллектуальных задач — именно это является конечной целью OpenAI, ключевого партнера Microsoft в сфере ИИ.
"Впрочем, Kosmos-1, похоже, является проектом исключительно Microsoft. Исследователи называют свою работу «мультимодальной большой языковой моделью» (MLLM). Для понимания изображения по аналогии с ChatGPT новая система преобразует иллюстрацию в серию преимущественно текстовых «токенов», которые анализируются вычислительной машиной. В дальнейшем текст и другие элементы обрабатываются специальным декодером", - говорится в материале.
Ранее Курсор информировал о том, что финские эксперты по безопасности заявили, что хакеры начнут использовать технологии искусственного интеллекта для осуществления кибератак. Согласно докладу компании WithSecure, риски использования ИИ в преступных целях возрастают, а в ближайшие 5 лет мы услышим о мошеннических методах похищения цифровых активов совместно с ИИ.
Как сообщал Курсор, искусственный интеллект назвал дату гибели цивилизации.
Также Курсор писал о том, что, по мнению ученых, искусственный интеллект может уничтожить человечество.
Морские глубины полны удивительных существ, и среди них каракатицы по праву считаются настоящими мастерами маскировки…
Первый прием пищи самый важный, ведь именно он оказывает наибольшее влияние на здоровье.
Эксперт объяснил, почему коты по ночам такие активные.
Без достаточного потребления жидкости рассчитывать на стройную фигуру не стоит, ведь вода — ключевой элемент…
Этот день, 4 апреля, 2025 обещает быть насыщенным: для одних знаков он принесет удачу и…
Гипертония годами может не давать о себе знать, но незаметно разрушать ваше здоровье.