%

Попробуй
бесплатно

01:08:03

4 дня

%

  • Компьютерная академия
  • Школа
  • Колледж
  • ВУЗ
  • Английский
  • Не школа музыки
Москва

Project Genie и Gemini Robotics: как Google научил ИИ строить миры и укрощать манипуляторы Franka Panda

Google представил Project Genie и Gemini Robotics 1.5 с Franka Panda: теперь ИИ управляет реальностью через простые команды. Разбираем прорыв в воплощенном ИИ и строим ваш маршрут в профессию будущего

Воплощенный ИИ учится через взаимодействие с окружающей средой
Воплощенный ИИ учится через взаимодействие с окружающей средой

Представьте: вы делаете на планшете небрежный скетч заброшенного замка, шепчете «добавь туман и блуждающих призраков» — и мир оживает, а вы не просто исследуете его шаг за шагом, а меняете на лету, как в игре. А теперь шагните дальше и дайте команду робо-руке Franka Panda прямо из браузера. Ничего непонятно, но очень интересно? Тогда давайте исследовать ИИ-новинки 2026 года от Google вместе. Рассказываем о возможностях воплощенного ИИ и подсказываем короткий путь в индустрию через образовательные программы Академии ТОП.

Кратко про воплощенный ИИ

Воплощенный ИИ/Embodied AI — это область разработки искусственного интеллекта, ориентированная на создание агентов, которые не просто обрабатывают данные, а взаимодействуют с физической средой или ее симуляцией.

В отличие от привычных языковых моделей и чат-ботов, такой ИИ обладает «телом» (робот в лаборатории или аватар в мире Project Genie), позволяющим воспринимать мир, рассуждать о нем и изменять его через действия. Он не просто знает, как закрутить гайку, он видит ее, понимает ее положение в пространстве и может сам ее закрутить.

Логика развития этой технологии строится на трех уровнях:

  1. Зрение/Vision — способность распознавать объекты.

  2. Рассуждение/Reasoning — понимание контекста задачи («Если я уроню этот стакан, он разобьется»)

  3. Действие/Action — перевод абстрактной мысли в точное движение.

Google собрал эти компоненты воедино. Он показал, как ИИ создает сложные среды (Project Genie) и как он учится в них действовать (Gemini Robotics).

Давайте посмотрим, как это работает на практике.

Нет времени читать статью?

Получите ответы от практикующих специалистов на бесплатном занятии в вашем городе

Нажимая на кнопку, я соглашаюсь на обработку персональных данных

Project Genie: ваши фантазии теперь интерактивны

Project Genie — это мультимодальная базовая модель мира, способная генерировать управляемые миры и игровые среды на основе одного изображения, текстового описания или наброска.

Модель может превратить любое статичное изображение, фотографию или даже карандашный набросок в интерактивную 2D-среду. В отличие от стандартных видеогенераторов, Genie создает пространство с последовательной физикой и логикой управления, позволяя пользователю (или ИИ-агенту) взаимодействовать с контентом в режиме реального времени.

Доступ открыт для подписчиков Google AI Ultra в США.

В чем технологический прорыв

Обычно, чтобы создать игру, нужны движки вроде Unreal Engine или Unity, сотни ассетов и прописанная физика. Genie делает все это «из коробки». Вы просто загружаете фото своей кошки на диване и оно практически мгновенно превращается в уровень в платформере, где диван — это препятствие, а кошка — игровой персонаж.

В документации указано, что Genie обучалась понимать латентное пространство действий. Это значит, что когда вы создаете уровень для игры из простого скетча, нейросеть «знает», что через забор нельзя пройти, а на диван можно запрыгнуть. Она сама выстраивает физику взаимодействия. Это революция для геймдева.

Если вы хотите не просто наблюдать за прогрессом, а сами развивать фантастические миры, рекомендуем курс Нейросети для быстрого создания игр в Академии ТОП. Здесь учат, как превращать идеи в интерактив, используя мощь современных алгоритмов.

Project Genie — первая в своем роде «модель мира», которая делает то, что раньше требовало сотен часов работы геймдизайнеров
Project Genie — первая в своем роде «модель мира», которая делает то, что раньше требовало сотен часов работы геймдизайнеров

Gemini Robotics 1.5: браузер как пульт управления реальностью

Gemini Robotics Embodied Reasoning 1.5 — это мультимодальная модель искусственного интеллекта класса VLA (Зрение/Vision — Язык/Language — Действие/Action), разработанная для управления робототехническими системами.

Google представил публичное демо, где каждый может повзаимодействовать с промышленной робо-рукой Franka Panda. Робот обладает двумя ключевыми навыками:

  1. Обнаружение/Detect. Вы пишете в чат: «красные кубики (red cubes)». Модель не ищет слово в базе данных. Она «смотрит» на видеопоток с камеры, проводит семантическую сегментацию и выделяет конкретные объекты на столе. Она понимает: «Вот это пятно пикселей — то, что нужно пользователю».

  2. Захват/Pickup. После обнаружения объекта Gemini рассчитывает его 3D-координаты и траекторию движения манипулятора Franka Panda. Раньше, чтобы робот взял кубик, программист писал жесткий код: «Двигайся в точку X:10, Y:20, Z:5». Если кубик сдвигался на сантиметр, робот захватывал пустоту. С Gemini Robotics Embodied Reasoning 1.5 вы общаетесь на человеческом языке. Модель использует пространственное мышление.

Хотите понимать, как это работает? Начните с курса «ИИ: нейросети для увеличения дохода» и возможности Gemini не будут для вас непознанной магией.

Google превращает сложнейшую кинематику в простой чат
Google превращает сложнейшую кинематику в простой чат
Мы собрали подборку курсов для людей с разным уровнем подготовки

Хотите стать программистом?

Мы собрали подборку курсов для людей с разным уровнем подготовкиПерейти

Частые вопросы

Правда ли, что в 2026 году ИИ начал массово заменять IT-специалистов?

Не совсем. Просто выросла потребность в специалистах, умеющих работать в связке с нейросетями.

Сколько зарабатывают те, кто умеет внедрять технологии воплощенного ИИ?

Эксперты в области воплощенного ИИ получают на 30–50% больше коллег без этих навыков. Зарплаты в РФ для таких позиций могут превышать 250–350 тысяч рублей.

Почему важно учиться именно сейчас?

В 2026 году «окно возможностей» начинает сужаться. Компании активно внедряют ИИ-агентов в бизнес-процессы. Через год конкуренция будет в разы выше.

Может ли ИИ сам научить меня всему необходимому?

ИИ — отличный ассистент, но не наставник. Чтобы эффективно использовать его мощь, нужно понимать логику работы. В Академии ТОП вы получаете не просто теорию, а менторство от практиков, а также формируете базовое портфолио.

Google наглядно показал: ИИ больше не заперт в чат-боте. Он становится интерфейсом ко всему — от виртуального платформера до промышленного робота. Граница между кодом и материей истончается. И сейчас — лучший момент, чтобы перестать быть просто наблюдателем и стать создателем. Технологии Google доступны немногим, но знания, которые позволяют ими управлять, открыты для вас уже сегодня на курсах Академии ТОП.

Хотите лучше разобраться в вопросе?

Приходите на бесплатное занятие в вашем городе и получите ответы от практикующих экспертов

Нажимая на кнопку, я соглашаюсь на обработку персональных данных

Мы свяжемся с вами в течение дня

💫

Перезвоним и поможем подобрать курс

👍

Запишем на бесплатные пробные занятия

💯

После рассчитаем финальную стоимость с учетом возможных льгот, текущих скидок и выбранного пакета