DeepMind презентовала Gemini Robotics: модель, созданную для реальных роботов с подвижными руками.

DeepMind презентовала Gemini Robotics: модель, созданную для реальных роботов с подвижными руками.

Компания представила две новые модели искусственного интеллекта, которые, по ее словам, «создают основу для нового поколения полезных роботов».Gemini Robotics — это усовершенствованная модель «зрение-язык-действие» (VLA), основанная на системе Gemini 2.0. Эта версия включает добавление физических действий в качестве выходного ответа на запрос. Например, на телефоне Pixel «ответом» Gemini было бы выполнение действия или ответ на вопрос. Gemini в роботе вместо этого воспримет эту команду как нечто, на что он должен физически отреагировать. Вторая модель — Gemini Robots-ER, представляющая собой «зрение-язык» (VLM) с «продвинутым пространственным пониманием». Эта версия Gemini обладает «воплощенным мышлением», что помогает ИИ эффективно ориентироваться в изменяющейся окружающей среде. В одном из видеопримеров, продемонстрированных Google для журналистов, робот может различать миски различной отделки и цвета на столе. Он также способен идентифицировать искусственные фрукты, например, виноград и бананы, и распределять их по соответствующим мискам. В другом примере робот понимает, как упаковать гранолу в ланч-бокс, что демонстрирует его способность обрабатывать детали. Основное внимание в этом анонсе уделяется похвале Google команде DeepMind за создание Gemini как «мозга» для робототехники. Это дополнительно подчеркивает интересный факт, что ИИ, который находится на вашем смартфоне, теперь может управлять гуманоидными роботами. Google сотрудничает с компании, такими ка...
12.03.2025
Сообщает: Источник  
Рубрика: «Наука и Техника»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Z.ai выпустила большую языковую модель с открытым исходным кодом GLM-4.7, созданную для реальных рабочих процессов разработкиZ.ai выпустила большую языковую модель с открытым исходным кодом GLM-4.7, созданную для реальных рабочих процессов разработки В преддверии Рождества Z.ai выпустила версию GLM-4.7, которая является последней... Сообщение Z.ai выпустила большую языковую модель с открытым исход ...

X5 создала отделение Robotics для разработки роботовX5 создала отделение Robotics для разработки роботов ПАО "Корпоративный центр ИКС 5" создаёт отдельное направление Х5 Robotics, которое станет одним из ключевых центров технологического развития компани ...

UBTech Robotics внедрила гуманоидных роботов на автозаводеUBTech Robotics внедрила гуманоидных роботов на автозаводе Китайская компания UBTech Robotics, специализирующаяся на создании гуманоидных роботов, объявила о внедрении своих роботов Walker S1 на заводе по про ...

Nvidia и Teradyne Robotics представили набор инструментов для создания ИИ-роботовNvidia и Teradyne Robotics представили набор инструментов для создания ИИ-роботов Датская компания Teradyne Robotics на конференции Nvidia GTC 2025 представила AI Accelerator — набор инструментов для разработки ИИ-приложений в робо ...

Google DeepMind и Принстон обучили ИИ-модель понимать мышление человекаGoogle DeepMind и Принстон обучили ИИ-модель понимать мышление человека Команда исследователей из Helmholtz AI (исследовательская инициатива в Германии), Google DeepMind, Принстонского университета и других организаций пр ...

Google представила ИИ-модель Gemini 2.5 Computer UseGoogle представила ИИ-модель Gemini 2.5 Computer Use Google представила новую ИИ-модель под названием Gemini 2.5 Computer Use, которая позволяет агентам взаимодействовать с веб-сайтами и пользовательски ...

Google представила обновлённую интеллектуальную модель Gemini 3Google представила обновлённую интеллектуальную модель Gemini 3 Компания Google анонсировала Gemini 3 Pro, свою новую продвинутую модель ИИ. Модель способна более глубоко анализировать запросы, учитывать контекст ...

Google представила свою самую продвинутую ИИ-модель  Gemini 2.5 ProGoogle представила свою «самую продвинутую» ИИ-модель — Gemini 2.5 Pro Компания Google представила свою «самую продвинутую» языковую модель Gemini 2.5 Pro. Модель может похвастаться улучшенными возможностями в области ан ...