Для понимания изображения по аналогии с ChatGPT новая система преобразует иллюстрацию в серию преимущественно текстовых «токенов», которые анализируются вычислительной машиной.
Pixabay
Корпорация Microsoft представила мультимодальную ИИ-модель Kosmos-1, способную анализировать содержание изображений, решать графические головоломки, распознавать текст, проходить визуальные тесты на IQ и понимать команды на естественном языке.
Об этом сообщает портал ToNeTo.
Отмечается, что, по мнению ученых, создание мультимодального ИИ, способного работать в текстовом, аудио- и графическом режимах (включая видео), — ключевой шаг на пути формирования «общего искусственного интеллекта» (AGI), готового справляться с многопрофильными задачами не хуже людей.
По мнению исследователей, мультимодальное восприятие является необходимым элементом для создания AGI в контексте получения знаний и связи с реальным миром.
Считается, что создание «общего искусственного интеллекта» позволит полностью заменить людей при выполнении любых интеллектуальных задач — именно это является конечной целью OpenAI, ключевого партнера Microsoft в сфере ИИ.
"Впрочем, Kosmos-1, похоже, является проектом исключительно Microsoft. Исследователи называют свою работу «мультимодальной большой языковой моделью» (MLLM). Для понимания изображения по аналогии с ChatGPT новая система преобразует иллюстрацию в серию преимущественно текстовых «токенов», которые анализируются вычислительной машиной. В дальнейшем текст и другие элементы обрабатываются специальным декодером", - говорится в материале.
Ранее Курсор информировал о том, что финские эксперты по безопасности заявили, что хакеры начнут использовать технологии искусственного интеллекта для осуществления кибератак. Согласно докладу компании WithSecure, риски использования ИИ в преступных целях возрастают, а в ближайшие 5 лет мы услышим о мошеннических методах похищения цифровых активов совместно с ИИ.
Как сообщал Курсор, искусственный интеллект назвал дату гибели цивилизации.
Также Курсор писал о том, что, по мнению ученых, искусственный интеллект может уничтожить человечество.
Гороскоп на июль 2025 года сулит особое финансовое преимущество трм знакам Зодиака благодаря их умению…
Мать заложника, удерживаемого террористами ХАМАСа, рассказала о своем "судьбоносном" решении.
Двое американских гуманитарных работников ранены в Газе: GHF обвиняет ХАМАС.
Неизвестные злоумышленники-антисемиты кричали "смерть ЦАХАЛу" во время нападения в Австралии.
Израиль отслеживает восстановление иранских ядерных и ракетных объектов и предупреждает о террористической активности.
Оптимизм связан с большей продолжительностью жизни — ученые.